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Introduction 


ES mathématiciens ont raisonné correctement durant des siècles sans connaître la logique formelle. La logique mo- 
derne est née de l’ambition de formaliser (mécaniser) le raisonnement mathématique : ce projet a reçu une impulsion 
décisive quand il est apparu que l’absence de formalisation pouvait conduire à des contradictions. Le développement 
actuel de la logique continue avec 
— le besoin de prouver la correction des programmes (particulièrement quand ces programmes sont utilisés dans des 
domaines où la sécurité est en jeu) 
— l’ambition de représenter en machine l’ensemble des connaissances mathématiques 
Cependant la terminologie des mathématiciens est restée différente de celle des logiciens. Pour exprimer que p im- 
plique g, le mathématicien dira par exemple : 
p entraîne q 
p est une condition suffisante de q 
pour que gq soit vrai, il suffit que p soit vrai 
g est une condition nécessaire de p 
pour que p soit vrai, il faut que g soit vrai 
Nous restreindrons notre étude à la logique classique (par opposition à la logique intuitionniste). La logique classique 
est la logique à deux valeurs de vérité. De plus cette logique est celle des circuits combinatoires, ce qui explique sa grande 
importance pratique. 


Plan : Nous présentons dans la première partie la logique propositionnelle. Plus précisément dans un premier chapitre 
nous donnons les définitions et résultats de base de la logique des prédicats. Dans le second chapitre nous parlons de la 
résolution propositionnelle en introduisant la résolution binaire, la stratégie complète et l’algorithme DPLL. Enfin nous 
illustrons une méthode de raisonnement logique en présentant la déduction naturelle. Dans le seconde partie du cours 
nous revisitons l’ensemble des notions, résultats et techniques présentés dans la première partie pour la logique du premier 
ordre. 


Exercices : Nous proposons à la fin de chaque chapitre une série d’exercices portant sur le contenu du chapitre. Nous 
indiquons par des étoiles la difficulté des exercices proposés, plus il y a d’étoiles plus l’exercice est difficile. Nous indi- 
quons par Ÿles exercices qui complètent les preuves vues durant le cours. Les exercices proposés sont de trois catégories. 
Nous avons des exercices : 

— Basiques qui aident l’étudiant à se familiariser avec le vocabulaire et à manipuler les notions introduites en cours. 

— Techniques qui sont des applications directes ou immédiates des résultats vus en cours. 

— Réflexifs qui permettent à l’apprenant à raisonner, démontrer, prouver des résultats à partir des techniques et 

notions apprises grâce aux deux autres types d’exercices. 


Objectifs : Les compétences et connaissances que nous souhaitons transmettre sont les suivantes : 
— Comprendre un raisonnement : être capable de déterminer si un raisonnement logique est correct ou non. 
— Raisonner, c’est-à-dire, construire un raisonnement correct utilisant les outils de la logique propositionnelle et du 
premier ordre. 
— Modéliser et formaliser un problème. 
— Écrire une preuve rigoureuse. 
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Première partie 


Logique propositionnelle 


Chapitre 1 


Logique propositionnelle 


Sommaire 

à 8 18 5 ee en8 6e 0 0000 5 Ge 5 se de aie de me doses dents ss etes es ee 12 
Re 12 
RU ee nn MS ee Re ad ne NE D Ne Ne à 14 
1.2 Sens des formules, ............. Re a eee se ne Ones dome ete 14 
14 

15 

15 

18 

19 

19 

21 

Pris ose SEMSMEL PILE LR ER EMI SVM AN L a ns 22 
À. ransformation en forme normale .................................. 22 
SE 23 
do te lots 24 
1.5 Algébre de Boolel. ............. ds See D De se nat emmenés 24 
[LS.1__ Définition et notations, ........................................ 24 
RS 25 

6 O ons booléennes! ........... ne Dindene sie due die à ne ne se de se de de eee se 29 
L.6.1__ Fonctions booléennes et somme de monômes] . ........................... 29 

6 onctions booléennes et produit de clauses| . ............................ 29 

7 = L’'outiLBDDCl. 5 48 54 6e pus rss hmrese ment ne mes eee ss 30 
[LS Exercices) .................. ISSN Ses ss ira siesrirnimande 31 


À RISTOTE fut un des premiers à essayer de formaliser le raisonnement en utilisant la logique des syllogismes. La lo- 

gique sert à préciser ce qu’est un raisonnement correct, indépendamment du domaine d’application. Un raisonnement 
est un moyen d’obtenir une conclusion à partir d’hypothèses données. Un raisonnement correct ne dit rien sur la vérité des 
hypothèses, il dit seulement qu’à partir de la vérité des hypothèses, nous pouvons déduire la vérité de la conclusion. Nous 
commençons l’étude de la logique par les lois de la logique propositionnelle. La logique propositionnelle est la logique 
sans quantificateurs qui s'intéresse uniquement aux lois gouvernant les opérations logiques suivantes : la négation (—) , la 
conjonction, autrement dit le «et » (A), la disjonction, autrement dit le « ou » (V), l'implication (—) et l’équivalence (4). 
Ces opérations sont également appelées connecteurs. La logique propositionnelle permet de construire des raisonnements 
à partir de ces connecteurs. Considérons l’exemple suivant qui comporte trois hypothèses : 


1. si Pierre est grand, alors Jean n’est pas le fils de Pierre, 
2. si Pierre n’est pas grand, alors Jean est le fils de Pierre, 


3. si Jean est le fils de Pierre alors Marie est la sœur de Jean. 
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Nous concluons que Marie est la sœur de Jean ou Pierre est grand. 

Afin de pouvoir raisonner nous extrayons la structure logique des hypothèses. Nous désignons les phrases « Pierre est 
grand », « Jean est le fils de Pierre », « Marie est la sœur de Jean » respectivement par les lettres p, j,m. Les hypothèses 
peuvent donc s’écrire : 


1. p= -)j, 
2. —p= j, 
3. j = m, 


et la conclusion se formalise en mV p. Nous montrons alors que les hypothèses impliquent la conclusion indépendamment 
de la nature des énoncés p, j,m. Pour cela nous prouvons que la formule suivante est vraie quelle que soit la vérité des 
propositions p, j,m. 

(= -ÿ) AGP AG m))> (mVp). 


Plan : Nous débutons ce chapitre par la syntaxe des formules logiques, c’est-à-dire, les règles permettant d’écrire des 
formules. Une formule peut être vraie ou fausse, ainsi nous devons être capable d’évaluer le sens d’une formule. Pour cela 
nous introduisons le sens de chaque connecteur ainsi que le calcul de la valeur d’une formule qui en dérive. Nous montrons 
alors un résultat de compacité qui sera principalement utilisé dans la seconde partie de ce livre. Ensuite nous présentons des 
équivalences remarquables utiles pour simplifier les raisonnements logiques. D’autres méthodes permettent de simplifier 
les raisonnements logiques, par exemple le remplacement et la substitution de formule. Nous montrons ensuite comment 
construire les formes normales conjonctives ou disjonctives d’une formule en utilisant les équivalences remarquables. 
Ces formes normales permettent d’exhiber facilement les modèles ou les contre-modèles d’une formule. Nous montrons 
ensuite que la logique propositionnelle est une instance d’une algèbre de Boole. Nous introduisons la notion de fonctions 
booléennes. Enfin, nous présentons succinctement l’outil BDDC['| développé par Pascal Raymond. Cet outil permet de 
manipuler les formules propositionnelles. 


1.1 Syntaxe 


Avant de raisonner, nous définissons le langage que nous utilisons. Ce langage est celui des formules construites à 
partir du vocabulaire suivant : 

— Les constantes : T et 1 représentant respectivement le vrai et le faux. 

— Les variables : une variable est un identificateur, avec ou sans indice, par exemple x, y1. 

— Les parenthèses : ouvrante ( et fermante ). 

— Les connecteurs : -,V,A,—=,4 respectivement appelés négation, disjonction (ou), conjonction (et), implication 

et équivalence. 

La syntaxe définit les règles de construction d’une formule de la logique propositionnelle. Nous introduisons deux modes 
d'écriture d’une formule, l’un strict, l’autre plus souple dans le sens qu’il autorise plusieurs écritures d’une même formule. 
Cette souplesse est obtenue grâce à l'introduction de priorités entre les connecteurs logiques. 


1.1.1 Formules strictes 


Ci-dessous, nous donnons les règles de construction d’une formule stricte à partir du vocabulaire donné précédemment. 


Définition 1.1.1 (Formule stricte) Une formule stricte est définie de manière inductive comme suit : 
— T'et L sont des formules strictes. 
— Une variable est une formule stricte. 
— Si A est une formule stricte alors —-A est une formule stricte. 
— Si A et B sont des formules strictes et si o est une des opérations V,A,—=,< alors (A o B) est une formule stricte. 


Dans la suite, nous désignons par © tout connecteur binaire, et nous appellons simplement formule une formule stricte. 
Les formules différentes de T, L et des variables sont des formules décomposables. 


Exemple 1.1.2 L'expression (a V (-b \c)) est une formule stricte construite suivant les règles précédentes. En revanche, 
aV(-bAc)et (aV(-(b)Ac)) ne sont pas des formules au sens de la définition [T.T.T] 


1. Mttp://www-verimag.imag.fr/-raymond/home/tools/bddc/ 
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L'intérêt de la définition de formules strictes est que les parenthèses permettent de trouver sans ambiguïté la structure 
des formules. Nous représentons la structure des formules par un arbre, où les feuilles contiennent les constantes ou les 
variables et les nœuds les connecteurs logiques. Le nœud racine est le connecteur à appliquer en dernier. 


Exemple 1.1.3 La structure de la formule (a V (-b \c)) est mise en évidence par l'arbre suivant : 


Une formule peut être vue comme une liste de symboles (connecteurs, parenthèses, variables, et constantes). Un 
facteur d’une telle liste est une suite de symboles consécutifs dans la liste. 


Définition 1.1.4 (Sous-formule) Nous appelons sous-formule d’une formule (stricte) À tout facteur de À qui est une 
formule (stricte). 


Exemple 1.1.5 (-b Ac) est une sous-formule de (aV (-b Ac)). 


Nous montrons que les formules sont décomposables d’une façon unique en leurs sous-formules. Ce résultat, précisé 
par le théorème [T.T.T3] est évident sur les exemples. L’unicité de la décomposition implique que nous pouvons identifier 
une formule et son arbre de décomposition. Ainsi, une sous-formule de la formule À pourra être identifiée comme un 
sous-arbre de l’arbre représentant la formule A. 

Afin de raisonner par induction sur la structure d’une formule, nous définissons la taille d’une formule. Nous remar- 
quons que la taille d’une formule correspond au nombre de connecteurs qu’elle contient. 


Définition 1.1.10 (Taille d’une formule) La taille d’une formule À, notée |A 


, est définie inductivement par : 


— |T|=0e|1|=0. 
— Si À est une variable alors |A] — 0. 
— |-A|=1+lA|. 


— |(AoB)}=}A|+1B+1. 


Exemple 1.1.11 |(aV (—-bAc))| = 


La faille des formules définie dans la définition[T.T.TO|est une mesure utile pour prouver par récurrence des propriétés sur 
les formules. 


Théorème 1.1.13 Pour toute formule À, un et un seul de ces cas se présente : 
— À est une variable, 
— À est une constante, 
— À s'écrit d’une unique façon sous la forme —B où B est une formule, 
— À s'écrit d’une unique façon sous la forme (B oC) où B et C sont des formules. 


Avec la définition de formules (strictes) nous écrivons de nombreuses parenthèses inutiles comme les parenthèses qui 
entourent chaque formule. Nous introduisons maintenant plus de souplesse dans notre syntaxe en définissant des priorités. 
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1.12 Formules à priorité 


Pour éviter la surabondance des parenthèses, nous définissons les formules à priorité. 


Définition 1.1.14 (Formule à priorité) Une formule à priorité est définie inductivement par : 
— T'et L sont des formules à priorité, 
— une variable est une formule à priorité, 
— si À est une formule à priorité alors —A est une formule à priorité, 
— si À et B sont des formules à priorité alors À ° B est une formule à priorité, 
— si À est une formule à priorité alors (A) est une formule à priorité. 


Exemple 1.1.15 Considérons la formule a V —b \ c qui est une formule à priorité mais pas une formule. 


En général, une formule à priorité n’est pas une formule (stricte). Nous montrons dans l’exercice 2 page 3[lque toute 
formule est une formule à priorité. Afin de pouvoir supprimer des parenthèses sans aucune ambiguïté nous définissons un 
ordre de priorité entre les différents connecteurs. 


Définition 1.1.16 (Ordre de priorité des connecteurs) La négation est prioritaire, puis dans l’ordre des priorités dé- 
croissantes, nous trouvons la conjonction (\), la disjonction (V), l'implication (=) et l’équivalence (&). 


À priorité égale, le connecteur gauche est prioritaire, sauf pour l’implication qui est associative à droite.f] 


Nous considérons qu’une formule à priorité est l’abréviation de la formule reconstituable en utilisant les priorités. Sauf 
exception, nous identifions une formule et son abréviation. Autrement dit, ce qui nous intéresse dans une formule, ce n’est 
pas son écriture superficielle, c’est sa structure, qui est mise en évidence par la syntaxe « stricte ». Ainsi la taille d’une 
formule à priorité sera égale à la taille de la formule stricte dont elle est l’abréviation. De même, pour les sous-formules, 
nous considérerons toujours la formule stricte dont la formule à priorité est l’abréviation. 


Exemple 1.1.17 Nous donnons plusieurs exemples d’abréviation de formule par une formule à priorité : 
— a\b/A\c est l’abréviation de 


— aN\bV cest l’abréviation de 


— aVb/A\c est l’abréviation de 


Maintenant que la syntaxe est définie, nous définissons le sens des formules. 


1.2 Sens des formules 


Nous cherchons à déterminer si une formule est vraie ou fausse indépendamment des valeurs affectées à ses variables. 
Nous définissons d’abord le sens des connecteurs logiques. Ensuite nous expliquons comment calculer la valeur d’une 
formule et montrons le théorème de compacité. Nous terminons cette section par la présentation de définitions de notions 
de base de la logique qui constituent le langage commun des logiciens. 


1.2.1 Sens des connecteurs 


Nous désignons les valeurs de vérité par 0 pour faux et par 1 pour vrai. La constante T vaut 1 et la constante L vaut 
0, ce qui nous conduit, le plus souvent, à confondre les constantes et leurs valeurs, et à utiliser indifféremment T, 1 et 


vrai, respectivement L, 0 et faux. Le sens des connecteurs logiques est donné par la table qui indique 
les valeurs des formules de la première ligne suivant les valeurs assignées aux variables x et y. 


2. C'est-à-dire a = b= c est l’abréviation de (a = (b= c)). 
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TX | xXVy | xXAY x y | x y 


m|nm|©|Oolx 
OH |ols 


TABLE 1.1 — Table de vérité des connecteurs. 


1.2.2 Valeur d’une formule 


Chacun sait évaluer une formule : nous associons à chaque variable de la formule une valeur dans l’ensemble B — 
{0,1}. La valeur de la formule est obtenue en remplaçant les variables par leurs valeurs et en effectuant les opérations 
suivant la table[T.1] Néanmoins, pour raisonner sur les formules, nous définissons formellement la valeur d’une formule. 


Définition 1.2.1 (Assignation) Une assignation est une application de l’ensemble de toutes les variables d'une formule 
dans l’ensemble 


Définition 1.2.2 (Valeur d’une formule) Soient À une formule et v une assignation, [A], dénote la valeur de la formule 
A dans l’assignation v. La valeur de [A|, est définie par récurrence sur l’ensemble des formules. Soient À, B des formules, 
x une variable et v une assignation. 
— [x], = v(x). 
TJ = 1, EL] = 0. 
— [A], = 1—[{A]|, autrement dit pour calculer la valeur de —A, nous soustrayons à 1 la valeur de A. 
— [A VB) = max{ [A], (81,}. 
(AAB)}, = min{[A},,[B},}. 
(A = B)}, = si [A], = 0 alors 1 sinon [B],. 
(A & B)}, = si [A], = [B], alors 1 sinon 0. 


D'après le théorème[T.T.T3 page TA] toute formule (stricte) se décompose de façon unique en l’un des cas ci-dessus. 
Ainsi l’extension de v aux formules est une application des formules dans B. En effet, soient 4 formules À ,4’,B, B' et deux 
opérations o et o/ telles que (A oB) = (4'0/B/). Par unicité de la décomposition, À = 4’,B = B',0 — o/, donc la valeur de 
la formule (A o B) est définie uniquement par une et une seule des lignes de la définition de la valeur. Il est clair que la 
valeur d’une formule ne dépend que de ses variables et de sa structure, aussi l’évaluation d’une formule est présentée sous 
la forme d’une fable de vérité. 


Définition 1.2.3 (Table de vérité d’une formule) Une table de vérité d’une formule À est un tableau qui représente la 
valeur de À pour toutes les valeurs possibles des variables de A. 


Chaque ligne de la table de vérité définit une assignation pour les variables des formules présentes dans les colonnes de 
la table et chaque colonne donne la valeur d’une formule. 


Exemple 1.2.4 Nous donnons la table de vérité des formules suivantes : x = y, —x, x V y, (x = y) & (x Vy) et xV -y. 


xæy|-x | -xVy | (x=y)e (xVy) | xV-y 


mn) ©|O©Olx 
Oo H|Ols 


1.2.3 Définitions et notions élémentaires de logique 


Nous listons les notions élémentaires de la logique. Nous illustrons par des exemples et contre-exemples chacune des 
définitions introduites afin d’en faire comprendre les subtilités. 


Définition 1.2.5 (Formules équivalentes) Deux formules À et B sont équivalentes si elles ont la même valeur pour toute 
assignation. 
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Exemple 1.2.6 Les colonnes des deux formules x = y et —xV y sont identiques dans l'exemple [T.Z.4 page précédente] 
Ces deux formules sont donc équivalentes. Par contre les formules x — y et xV —y ne sont pas équivalentes car elles n’ont 
pas les mêmes tables de vérité. 


Remarque 1.2.7 Nous n'utilisons pas le symbole du connecteur logique & pour dire que À et B sont équivalentes. Nous 
notons que les formules À et B sont équivalentes par À = B ou simplement À = B si le contexte nous permet de comprendre 
que le signe égal indique l’équivalence. Ainsi, x = y = —xV y signifie que la formule x — y est équivalente à la formule 
XV y. 


Définition 1.2.8 (Valide, tautologie) Une formule est valide si elle a la valeur 1 pour toute assignation. Une formule 
valide est aussi appelée une tautologie. 


Exemple 1.2.9 En regardant la table de vérité de l'exemple[T.Z.4 page précédente|nous obtenons que : 


— la formule (x = y) & (-xV y) est valide ; 
— la formule x = y n’est pas valide car 


Notation : — À dénote le fait que la formule À est valide. Nous pouvons écrire | x V x, car x V -x est une tautologie. 


Propriété 1.2.10 Les formules À et B sont équivalentes si et seulement si la formule À & B est valide. 


Preuve : La propriété est une conséquence de la table[T.T page précédenteJet des définitions précédentes. 
— Si les formules À et B sont équivalentes cela signifie qu’elles ont la même table de vérité, ainsi d’après la définition 


du connecteur + donnée dans la table[T.T page précédentella table de vérité de À 4 B contient uniquement des 1 
donc À & B est valide. 


< Si la formule À & B est valide, nous déduisons que la table de vérité de À & B contient uniquement des 1, ainsi 


d’après la définition du connecteur ++ donnée dans la table [T.T page précédentelles tables de vérité de A et de B 


coïncident donc les formules À et B sont équivalentes. 


Définition 1.2.11 Modèle d’une formule) Une assignation v qui donne la valeur 1 à une formule est un modèle de la 
formule. Nous dirons aussi que v satisfait la formule ou que v rend vraie la formule. 


Exemple 1.2.12 x — y a pour modèle 


Cette notion de modèle s’étend aux ensembles de formules comme suit. 


Définition 1.2.13 (Modèle d’un ensemble de formules) Une assignation est un modèle d’un ensemble de formules si et 
seulement si elle est un modèle de chaque formule de l’ensemble. 


Exemple 1.2.14 


Propriété 1.2.15 Une assignation est un modèle d’un ensemble de formules si et seulement si elle est un modèle de la 
conjonction des formules de l’ensemble. 


Preuve : La preuve est demandée dans l’exercice[[T page 
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Exemple 1.2.16 L'ensemble de formules {a = b,b = c} et la formule (a = b)\(b = c) ont les mêmes modèles. 


Définition 1.2.17 (Contre-Modèle) Une assignation v qui donne la valeur 0 à une formule est un contre-modèle de la 
formule. Nous dirons que v ne satisfait pas la formule ou v rend la formule fausse. 


Exemple 1.2.18 x — y a pour contre-modèle 


Remarque 1.2.19 (Contre-modèle d’un ensemble de formules) La notion de contre-modèle s'étend aux ensembles de 
formules de la même manière que la notion de modèle. 


Définition 1.2.20 (Formule satisfaisable) Une formule (respectivement un ensemble de formules) est satisfaisable s’il 
existe une assignation qui en est un modèle. 


Définition 1.2.21 (Formule insatisfaisable) Une formule (respectivement un ensemble de formules) est insatisfaisable si 
elle (respectivement s’il) n’est pas satisfaisable. 


Une formule (respectivement un ensemble de formules) insatisfaisable ne possède pas de modèle. Sa table de vérité 
ne comporte que des 0. La négation d’une tautologie est donc une formule insatisfaisable. 


Exemple 1.2.22 


Remarque 1.2.23 Les logiciens utilisent le mot consistant comme synonyme de satisfaisable et contradictoire comme 
synonyme d’insatisfaisable. 


Définition 1.2.24 (Conséquence) Soient T un ensemble de formules et À une formule : À est conséquence de l’ensemble 
T d’hypothèses si tout modèle de V est modèle de À. Le fait que À soit conséquence de TV est noté par TH A. 


Exemple 1.2.25 D'après la table de vérité suivante, la formule a = c est conséquence des hypothèses a = b etb = c. 


SR IR Ro GSISISGIS 
SRI SSII GISI 
SOIR ISIRI GISI 


Remarque 1.2.26 (Validité et conséquence) Nous notons À est valide par | À, car À est valide si et seulement si À est 
conséquence de l’ensemble vide. 


Maintenant, nous établissons l’équivalence de la validité d’une formule composée d’hypothèses et d’une conclusion 
avec la conséquence de la conclusion à partir des hypothèses mais aussi avec l’insatifaisabilité des hypothèses et de la 
négation de la conclusion. Ces relations sont constamment utilisées dans les exercices et les démonstrations. 


Propriété 1.2.27 Soient n + 1 formules A1,...,A,, B. Soit H, la conjonction des formules A1,...,A,. Les trois formula- 
tions suivantes sont équivalentes : 


1. A1,...,4n E B, c’est-à-dire B est conséquence des hypothèses A1,...,An. 
2. La formule H, = B est valide. 
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3. H, 1 -8B est insatisfaisable. 


Preuve : La propriété est une conséquence de la table[T.T page 15]et des définitions précédentes. Soient n + 1 formules 
A, An,B et Hn= AA... AA. 


= 2: Supposons que A1,...,4, = B, c’est-à-dire tout modèle de A1,...,4, est aussi modèle de B. 


Nous obtenons donc dans tous les cas que H, = B est valide. 

BI=B: Supposons que H, = B est valide, cela signifie que pour toute assignation v, [H, = B], = 1. D’après la 
table [LT page 15] nous avons deux possibilités soit [H,], — 0, soit [H,], — 1 et [B], = 1. Or [H, À -B], = 
min([Hlv,[-8],) = min([H;],, 1 — [B];). Dans les deux cas, nous obtenons [H, A -B], — 0. Nous concluons donc 
que H, | -B est insatisfaisable. 

Bl=[: Supposons que H, | -B est insatisfaisable, c’est-à-dire que pour toute assignation la formule H, A -B est 
contradictoire. Montrons que les modèles de A1,...,A, sont aussi des modèles de B. 

Soit v une assignation modèle de A1,...,4,, il en découle que [A;|, = 1 pour i = 1,...,n donc [H,], = [Ai A...A 
An]v = 1. D’après notre hypothèse, nous en déduisons que [-B], — 0. D'où, 1 —[B], — 0. Nous avons donc [B], = 1, 
c’est-à-dire que v est aussi un modèle de B. 


En utilisant le résultat de l’exercice [page 37]nous concluons. 


Exemple 1.2.28 Nous considérons les deux formules a = b et b = c, nous illustrons le théorème précédent en prouvant 
quea=b,b=cha= c, soit en montrant que (a = b)A\(b = c) = (a = c) est une tautologie, soit que (a = b)A(b = 
c)A (a = c) est insatisfaisable. Pour cela nous donnons la table de vérité associée à ces formules. 


ab|b=c |) a=c|(a=b)A(b=c)= (ac) | (a=b)A(b=c)A-(a= c) 


SRI I RG oo) GIR 
SI SSII R GS ol 


RON ONG RQ Io 


D ES ESS ES EE EE EE 
DE ES EE EE ES EE EE 
EE ES EE ESS ES EE EE EE 


1.2.5 Équivalences remarquables 


Raisonner par équivalence c’est utiliser les propriétés de l’équivalence (réflexivité, symétrie, transitivité), et la pro- 
priété de remplacement d’une formule par une autre formule équivalente pour obtenir de nouvelles équivalences à partir 
des équivalences déjà prouvées ou admises. Ci-dessous, nous listons des équivalences remarquables de la logique. 


1. La disjonction est : 
— Associative, c’est-à-dire, x V (yVz) = (xV y) Vz. 
— Commutative, c’est-à-dire, x V y = y V x. 
— 0 est l’élément neutre de la disjonction, c’est-à-dire, O0 V x = x. 


2. La conjonction est : 
— Associative, c’est-à-dire, x A (y Az) = (xA y) Az. 
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— Commutative, c’est-à-dire, x A y = y Ax. 
— 1 est l’élément neutre de la conjonction, c’est-à-dire, 1 A x = x. 


3. La conjonction est distributive sur la disjonction : x A (y Vz) = (xA y) V (x Az). 
4. La disjonction est distributive sur la conjonction : xV (y Az) = (xV y) A (xVz). 


5. Les lois de la négation : 
— xA-x=0. 
— xV-x=l (Le tiers-exclus). 


TX = X. 
—0 =]. 
—1=0. 


© œ nn 


Les lois de De Morgan : 
— —(xAy) = -xV -y. 
— —(xVy)=-xA-y. 
10. 0 est l’élément absorbant de la conjonction : 0 A x = 0. 
11. 1 est l’élément absorbant de la disjonction : 1Vx= 1. 


12. idempotence de la disjonction : x Vx = x. 


13. idempotence de la conjonction : xA x = x. 


Les équivalences|1 page ci-contre alse démontrent à l’aide de tables de vérité] Les équivalences [6] [13]se déduisent 
des équivalences | page ci-contre à] comme nous le montrons dans la section|[.5 page 24 Ci-dessous, nous donnons 


quelques lois de simplification qui permettent d’alléger les raisonnements logiques. 


Propriété 1.2.31 (Lois de simplification) Pour tout x,y nous avons : 
— xV(XAY) =x. 
XA(xV y) =x. 

— xV(-xAy)=xVy. 
XA(-xVy)=xAy. 


Preuve : En utilisant les équivalences remarquables nous prouvons les trois lois de simplification. La preuve est demandée 


dans l’exercice|[2 page 


1.3 Substitution et remplacement 


Dans ce paragraphe, nous étendons l’ensemble des formules valides par substitution et remplacement. 


1.3.1 Substitution 


Définition 1.3.1 (Substitution) Une substitution est une application de l’ensemble des variables dans l’ensemble des 
formules. L'application d’une substitution © à une formule consiste à remplacer dans la formule toute variable x par la 
formule ô(x). 


Notation : Soit À une formule, nous notons AG ou G(A) l'application de la substitution © à la formule À. 


Définition 1.3.2 (Support d’une substitution, substitution à support fini) Le support d’une substitution 6 est l’ensemble 
des variables x telles que x6 Æ x. Une substitution © à support fini est notée < x1 :—= A1,...,Xn := An >, où A1,...,A, sont 
des formules, X1,...,x, sont des variables distinctes ef la substitution vérifie : 

— pour i de 1 à n, x;j6 = À; 

— pour toute variable y telle que y & {x1,...,Xn}, nous avons : yG = y 


3. Nous laissons le soin au lecteur de se convaincre de la véracité de ces équivalences en construisant les tables correspondantes. 
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Exemple 1.3.3 Soient la formule À =xVx/Ay= z/ y et la substitution 6 =<x:=aVb,z:=bAc >, 6 appliquée à A 
donne : 


Le support de 6 est fini et comporte les variables x et z. 


Propriété 1.3.4 Soient À une formule, v une assignation et G une substitution, nous avons [A6], — [A], où pour toute 
variable x, w(x) = [6(x)],. 


Preuve : Soient À une formule, v une assignation et © une substitution, nous voulons montrer que [Ac], — [A], où pour 
toute variable x, w(x) = [6(x)],. Par une récurrence sur la taille des formules, nous obtenons : 


Cas de base : |A] — 0. 


Induction : 
Supposons que la propriété soit vraie pour toute formule de taille inférieure ou égale à n, montrons qu’elle est 
vraie pour une formule À de taille ñn +1 : 


Exemple 1.3.5 Soit À = xV yV d une formule. Soit 6 =< x:=aVb,y:=b/Ac > une substitution. Soit v une assignation 
telle que v(a) = 1, v(b) = 0, v(c) = 0, v(d) = 0. Nous avons : 


Théorème 1.3.6 L'application d’une substitution à une formule valide donne une formule valide. 


Preuve : Soient À une formule valide, 6 une substitution et v une assignation quelconque. D’après la propriété [1.3.4]: 
Ao], = [A], où pour toute variable x, w(x) = [o(x)],. Puisque À est valide, [A], = 1. Par suite AG vaut 1 dans toute 
assignation, c’est donc une formule valide. 


Exemple 1.3.7 Soit À la formule -(p A q) & (-p V -q). Cette formule est valide, c'est une équivalence remarquable. 
Soit 6 la substitution suivante : < p := (aVb),q := (cAd) >. La formule 
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La substitution est définie sur les formules, pour l’appliquer sans erreur aux formules à priorité, il suffit que l’image, 
par la substitution, de toute variable soit une variable, une constante ou une formule entre parenthèses. 


1.3.2 Remplacement 


La notion de substitution ne nous permet pas de remplacer une formule par une formule, nous introduisons la notion 
de remplacement à cette fin. 


Définition 1.3.8 (Remplacement) Soient A,B,C,D des formules. La formule D est obtenue en remplaçant dans C cer- 
taines occurrences de À par B, s’il existe une formule E et une variable x telles que, C=E <x:=A>etD=E <x:=B3. 


Exemple 1.3.9 Considérons la formule C = ((a = b)V -(a = b)). 


— La formule obtenue en remplaçant toutes les occurrences de (a = b) par (a \b) dans C est 


elle est obtenue en considérant la formule E = (xV -x) et les substitutions < x := (a Ab) > et <x:=(a= b) >. 
— La formule obtenue en remplaçant la première occurrence de (a = b) par (a \b) dans C est 


elle est obtenue en considérant la formule E = (xV -(a = b)) et les substitutions < x := (ab) > et <x:=(a= 
b) >. 


La différence entre une substitution et un remplacement est qu’une substitution remplace un ensemble de variables par 
des formules alors qu’un remplacement remplace les occurrences de certaines formules par une autre formule en utilisant 
des substitutions. 


Théorème 1.3.10 Soient C une formule et D la formule obtenue en remplaçant, dans C, des occurrences de la formule A 
par la formule B, alors (A& B)(C£&D). 


Preuve : Par définition du remplacement, il existe une formule Æ et une variable x telles que, C = E < x:= A > et 
D=E <x:=B >. Supposons que v est une assignation modèle de (A & B). Nous avons donc [A], = [B|,. D’après la 
propriété[TETT page erconra 

[C], = [E}» où w est identique à v sauf que w(x) = [A], 

D}, = [E],y où w’ est identique à v sauf que w’(x) = [B], 

Puisque [A], — [B],, les assignations w et w’ sont identiques, donc [C], — [D],. Par suite v est modèle de (C & D). 


Corollaire 1.3.11 Soient C une formule et D la formule obtenue en remplaçant, dans C, une occurrence de la formule A 
par la formule B, alors À =B implique C = D. 


Preuve : Si A = B, alors la formule (A & B) est valide (propriété|1.2. 10), donc la formule (C D) également puisqu'elle 
est, d’après le théorème ci-dessus, la conséquence de (A & B), par suite C = D. 


Exemple 1.3.12 Le remplacement d’une occurrence d’une formule À par une occurrence de B est mis en évidence par 
des boîtes marquant ces occurrences. 


— D'après théorème|1.3.10/: pégqgE(pV(pl=r)e(pV(al= r)). 
— D'après le corollaire|1.3.11|: (-(pVg) = ([-(pVa)|Vr))=(-(pVa)=((-pA-Q)\Vr)), puisque -(pV q) = 
(PA). 


Remarque 1.3.13 Le théorème précédent et son corollaire s'appliquent aux formules. Quand nous faisons un rempla- 
cement directement sur une formule à priorité, nous devons nous assurer que ce remplacement reste correct sur les 


— 


formules (strictes) sous peine de commettre des erreurs. Par exemple, considérons les deux équivalences a | b|=a/|b 
etc —=d=cVd.Remplaçons b à gauche par -c = d'et à droite par c V d. Nous observons que bien que -c = d=cVd, 
a\=c=dZÆaAcVd, car pour a = c = d = 0, la formule de gauche vaut 1 et celle de droite vaut 0. Ici le corollaire 
ne doit pas être appliqué à l'occurrence encadrée car a \ -c = d est une abréviation de ((a \-c) = d), donc -c = d 
n'apparaît pas comme une occurrence possible de a \ -c = d. 


Nous avons défini les remplacements à partir des substitutions, nous allons maintenant appliquer les remplacements à 
une formule afin de la transformer en une formule en forme normale équivalente. 
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1.4 Formes Normales 


Mettre une formule en forme normale consiste à la transformer en une formule équivalente ayant des propriétés 
structurelles. Nous introduisons deux notions de formes normales : la forme normale disjonctive qui permet de mettre 
en évidence les modèles et la forme normale conjonctive qui exhibe les contre-modèles. La définition de forme normale 
nécessite l’introduction des concepts de littéral, monôme et clause. 


Définition 1.4.1 (Littéral, monôme, clause) 
— Un littéral est une variable ou la négation d’une variable. 
— Un monôme est une conjonction de littéraux. 
— Une clause est une disjonction de littéraux. 


Exemple 1.4.2 Nous illustrons par quelques exemples simples ces nouvelles notions : 
— X,y, 2 sont des littéraux. 
— x/\—y/Azest un monôme dont l'unique modèle est x = 1,y =0,z= 1. 
— Le monême x \-—y/Az/\-x comporte une variable et sa négation : il vaut 0. 
— xV-yVzest une clause dont l’unique contre modèle est x =0,y = 1,z=0. 
— La clause xV —yV zV -x comporte une variable et sa négation : elle vaut 1. 


1.4.1 Transformation en forme normale 


Nous introduisons la notion de forme normale et montrons qu’il est toujours possible de transformer une formule en 
une formule équivalente en forme normale. 


Définition 1.4.3 (Forme normale) Une formule est en forme normale si elle n'utilise que les opérateurs \,V,- et que 
les négations sont uniquement appliquées aux variables. 


Exemple 1.4.4 La formule —a V b est en forme normale, alors que la formule a = b n'est pas en forme normale bien 
qu'elle soit équivalente à la première. 


Nous expliquons maintenant comment transformer toute formule en une formule en forme normale équivalente grâce 
à des remplacements. Appliquer l’équivalence À = B à la formule C, c’est remplacer dans C une occurrence de À par une 
occurrence de B : nous avons prouvé dans le théorème[T.3.T0 page précédente|qu’un tel remplacement change C en une 
formule équivalente. Ainsi pour transformer une formule en une formule équivalente de forme normale, nous appliquons 
les transformations suivantes : 


1. Élimination des équivalences : remplacer une occurrence de À & B par l’une des sous-formules : 
(a) (-AVB)A(-BVA). 
(b) (AAB)V(-AA-B). 

2. Élimination des implications : remplacer une occurrence de À — B par —A VB. 


3. Déplacement des négations : remplacer une occurrence de 
(a) —-A par À. 
(b) —(A VB) par A A -B. 
(c) (A AB) par —A V -B. 
ainsi les négations ne portent que sur des variables. 

En appliquant ces trois transformations dans l’ordre indiqué, il est clair que la formule initiale a été transformée en 
une formule en forme normale équivalente. Dans l'exercice [23 page 34] nous prouvons que l’ordre des transformations 
n’est pas important : en effectuant les transformations ci-dessus dans un ordre quelconque, nous obtenons finalement une 
formule équivalente en forme normale. 


Remarque 1.4.5 1! est par exemple recommandé de remplacer une sous-formule de la forme -(A = B) par À À -B, ce 
qui en fait combine une élimination de l'implication et un déplacement de la négation. En pratique, il est plus efficace de 
simplifier le plus tôt possible de la façon suivante : 

— Remplacer par 0 une conjonction qui comporte soit comporte une formule et sa négation, soit un 0. 

— Remplacer par 1 une disjonction qui comporte soit une formule et sa négation, soit un 1. 

— Remplacer -1 par 0 et —0 par 1. 

— Enlever les 0 des disjonctions et les 1 des conjonctions. 

— Appliquer les simplifications x V (xAy)=x x A(xVy)=x xV(=xAy) =xVy. 

— Appliquer l’idempotence de la disjonction et de la conjonction. 
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1.42 Transformation en forme normale disjonctive (somme de monômes) 
La forme normale disjonctive permet de trouver facilement des modèles. 


Définition 1.4.6 (Forme normale disjonctive) Une formule est une forme normale disjonctive (en bref fnd) si et seule- 
ment si elle est une disjonction (somme) de monômes. 


L'intérêt des formes normales disjonctives est de mettre en évidence les modèles. 


Exemple 1.4.7 (x A y) V (-xA-yA2z) est une fnd composée de deux monômes, chacun d’eux nous donne un des deux 
modèles possibles : 


En partant d’une forme normale et en distribuant toutes les conjonctions sur les disjonctions, nous obtenons une 
disjonction de monômes. Pour cela il faut aussi savoir regrouper plusieurs applications de la distributivité. 


Exemple 1.4.8 Dans une transformation en disjonction de monômes, nous pouvons appliquer de gauche à droite l’équi- 
valence (aV b) A(cVdVe)= 


La transformation par équivalence d’une formule en une disjonction de monômes peut être utilisée pour déterminer si 
une formule est valide ou non. Soit À une formule dont nous souhaitons déterminer la validité : Nous transformons —A en 
une disjonction de monômes équivalente à —A. Si A — 0 alors À — 1 donc À est valide, sinon, toutes simplifications étant 
faites, A est égal à une disjonction de monômes non nuls, qui nous donnent des modèles de —A, donc des contre-modèles 
de À. 


Exemple 1.4.9 Soit A = {(p = (q = r)) = (pAgq= r). Déterminons si À est valide par transformation de —A en disjonc- 
tion de monômes. 


Exemple 1.4.10 Soit A = ((a = b) Ac) V (ad). Déterminer si A est valide par transformation de —A en disjonction de 
monômes. 


—AÀ 

= -((a = b)Ac)A-(aAd) par déplacement des négations 

= (-(a= b)V-c) A(-aV -d) par déplacement des négations 

= (aA-bV-c)A(-aV -d) par combinaison du déplacement d’une négation 


et élimination de l'implication 
= (aA-bA-a)V(aA-bA-d)V(-cA-a)V(-cA-d) par distributivité de la disjonction sur la conjonction 
= (aA-bA-d)V (=cA-a)V(-cA-d) par simplification 


Nous obtenons 3 modèles de —A (a=1,b=0,d=0;a=0,c=0; c=0,d =), c’est-à-dire, des contre-modèles de 
À. Donc À n’est pas valide. 
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1.43 Transformation en forme normale conjonctive (produit de clauses) 


La forme normale conjonctive permet d’exhiber facilement des contre-modèles. 


Définition 1.4.11 (Forme normale conjonctive) Une formule est une forme normale conjonctive (en bref fnc) si et seule- 
ment si elle est une conjonction (produit) de clauses. 


L'intérêt des formes normales conjonctives est de mettre en évidence des contre-modèles. 


Exemple 1.4.12 (xVy)A(-xV -yVz) est une fnc, qui a deux contre-modèles 


Par convention, nous considérons que 0 et 1 sont des disjonctions de monômes et des conjonctions de clauses. Nous 
appliquons la distributivité (inhabituelle) de la disjonction sur la conjonction, autrement dit nous remplaçons toute sous- 
formule À V (BAC) par (A V B) A (A VC), et toute sous-formule (BAC) VA par (BVA)A(CVA). 


Exemple 1.4.13 Nous reprenons l’exemple|1.4.8 page précédentelet obtenons (a Ab) V (cAd/Ae) = 


La transformation par équivalence d’une formule en une conjonction de clauses de littéraux peut aussi être utilisée 
pour déterminer si une formule est valide ou non. Soit À une formule dont nous souhaitons déterminer la validité : Nous 
transformons À en une conjonction de clauses équivalente à A. Si À — 1 alors À est valide, sinon, toutes simplifications 
étant faites, À est égale à une conjonction de clauses non égales à 1, et chacune de ces disjonctions nous donne un contre- 
modèle de A. 


1.5 Algèbre de Boole 


Cette notion fut introduite par le mathématicien britannique George Boole au milieu du XIX° siècle. Elle permet no- 
tamment de traduire les propositions en équations (généralement, cette écriture est plus concise). Nous rappelons d’abord 
la définition d’une algèbre de Boole. Nous déduisons alors que la logique propositionnelle est une algèbre de Boole. 
Ensuite nous prouvons certaines propriétés usuelles des algèbres de Boole. Nous terminons cette section en présentant la 
notion de dualité. 


1.5.1 Définition et notations 


La définition d’algèbre de Boole donnée ci-dessous est minimale en nombre d’axiomes. 


Définition 1.5.1 Une algèbre de Boole est un ensemble d'au moins deux éléments, 0, 1, et trois opérations, complément 
(le complément de x est noté X), somme (+) et produit (.), qui vérifient les axiomes suivants : 


1. la somme est : 
— associative : x+(y+2) = (x+y)+2 
— commutative : X+y=Yy+x, 
— 0 est élément neutre de la somme : O+x—x, 


2. le produit est : 
— associatif : x.(y.z) = (x.y).z, 
— commutatif : X.y = Y.X, 
— l'est élément neutre du produit : 1.x = x, 


3. le produit est distributif sur la somme : x.(y +2) = (x.y) + (x.2), 
4. la somme est distributive sur le produit : x + (y.z) = (x+y).(x +2), 
5. les lois de la négation : 

— x+x=lI, 

— xX=0. 
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Attention, le fait que la distributivité de la somme sur le produit n’est pas usuelle rend son application propice aux 
erreurs. 

Comme indiqué précédemment dans la sous-section [7.5 page T8] nous pouvons prouver en utilisant des tables 
de vérité que la logique propositionnelle vérifie l’ensemble des axiomes d’une algèbre de Boole. Aïnsi nous pouvons 
considérer la logique propositionnelle comme la plus petite algèbre de Boole, car elle contient deux éléments. De ce fait, 
nous pouvons utiliser les notations booléennes (plus condensées) en lieu et place des notations propositionnelles, comme 
indiqué dans la table de correspondance donnée dans la figure[T.1] Nous conseillons de les utiliser pour effectuer de gros 
calculs. Par ailleurs, observez que ces notations sont fréquemment utilisées dans le domaine du matériel. 


notations logiques notations booléennes 
4 a 
a/\b a.b 
aVb a+b 
ab a+b 
ab a.b+(a.b) ou (a+b).(a+b) 


FIGURE 1.1 — Correspondance entre l’algèbre de Boole et la logique propositionnelle. 


Remarque 1.5.2 (Conventions d’écriture) 

— Parfois, la négation est utilisée à la place du complémentaire. Par exemple, —a dénote a et —(a+b) représente 
a+ b. 

— Afin de permettre l’omission du point, dans les notations booléennes, les variables sont souvent dénotées par une 
seule lettre (avec ou sans indice). Ainsi lorsque a et b sont des variables, des formules entre parenthèses ou sous 
une barre de négation, nous abrégeons a.b en ab suivant une pratique usuelle en mathématiques. 

— Enfin l’équivalence de deux formules est systématiquement notée avec le symbole = au lieu du symbole =. 


Il est important de noter que la logique propositionnelle n’est pas l’unique algèbre de Boole. Par exemple, l’ensemble 
P(X) des sous-ensembles d’un ensemble X est une algèbre de Boole, comme nous l’indique la mise en correspondance 
des opérateurs ensemblistes avec leur désignation dans l’algèbre de Boole dans la figure[T.2] 


Algèbre de Boole | P(X) 
1 X 
0 (] 

P X—p 

p+q pUgq 

D-q png 


FIGURE 1.2 - Correspondance entre l’algèbre de Boole et P(X). 


Puisque les lois de simplification sont déduites des lois de l’algèbre de Boole, comme nous allons le montrer dans la 
suite, elles sont vérifiées dans toute algèbre de Boole. En particulier dans l’algèbre de Boole P(X) nous avons AU(ANB) = 
À. Une preuve dans l'algèbre de Boole est une suite d’égalités, permettant de passer d’une formule à une autre formule 
équivalente en utilisant les axiomes ou simplifications de l’algèbre de Boole. 


1.5.2 Propriétés 


Nous présentons certaines des propriétés qui découlent de la définition de l’algèbre de Boole et qui sont couramment 
utilisées dans les raisonnements. Pour raccourcir les preuves de ces propriétés, nous utilisons implicitement l’associativité 
et la commutativité de la somme et du produit. 


Propriété 1.5.3 Dans une algèbre de Boole, pour tout x, il y a un et un seul y tel que x+y = 1 et xy = 0, autrement dit la 
négation est unique. 
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Preuve : Il y a un élément y vérifiant x + y = 1 et xy = 0, c’est x d’après les axiomes de l’algèbre de Boole. Montrons 
qu’il est unique. Raisonnons par contradiction, supposons qu’il n’est pas unique, nous avons donc qu’il existe y et z deux 
éléments distincts tels que x +y = 1, xy = 0, x+z = 1, et xz = 0. Nous considérons u = xy +7. Puisque xy = 0, nous 
avons : u — Z. Par distributivité de la somme sur le produit, nous avons : u = (x+z)(y +2). Puisque x +7 = 1 et que 1 
est l’élément neutre du produit, nous avons : u = y +7. Nous concluons donc que z = y +7. En considérant v = xz + y et 
échangeant les rôles de y et z, nous obtenons de façon analogue y = y +z. Par suite y — z, ce qui prouve donc l’unicité de 
la négation. 


Propriété 1.5.4 Dans une algèbre de Boole, les équivalences suivantes sont vraies pour tout x et tout y : 


T; 


Idempotence du produit : x.x = x. 
Idempotence de la somme : x+x = x. 
1 est élément absorbant de la somme : 1+x=—1. 


0 est élément absorbant du produit : O.x = 0. 
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Preuve : 


le T0 


4. Idempotence du produit : x.x = x. 
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5. Idempotence de la somme : x +x = x. 


6. 1 est élément absorbant de la somme : 1+x=—]l. 


7. 0 est élément absorbant du produit : O.x = 0. 


8. Lois de De Morgan : 


— FJ=X+ÿ: 
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1.6. Fonctions booléennes 29/129 


1.6 Fonctions booléennes 


Nous regardons maintenant nos formules comme des fonctions mathématiques sur le domaine B = {0,1}. Nous 
définissons formellement ce qu’est une fonction booléenne, puis nous revisitons les formes normales conjonctives et 
disjonctives avec ce formalisme. Remarquons que les fonctions booléennes sont des notions utilisées en cryptologie par 
exemple dans la construction de chiffrements symétriques (le chiffrement One-Time-Pad, un des chiffrements les plus 
sûrs est basé sur la fonction booléenne du « ou-exclusif »). 


Définition 1.6.1 (Fonction booléenne) Une fonction booléenne f est une fonction dont les arguments et le résultat sont 
dans le domaine B = {0,1}. 


f:B"- 


Exemple 1.6.2 Nous donnons des exemples et contre-exemples de fonctions booléennes : 
— La fonction f : B — B : f(x) = -x est une fonction booléenne. 
— La fonction f :N —B: f(x) = x mod 2 n’est pas une fonction booléenne. 
— La fonction f :B —N: f(x) =x+1 n'est pas une fonction booléenne. 
— La fonction f : B x B — B: f(x,y) = -(xA y) est une fonction booléenne. 


1.6.1 Fonctions booléennes et somme de monômes 


Grâce aux fonctions booléennes, nous sommes capables à partir des valeurs de vérité d’une formule de reconstruire la 
somme de monômes correspondante. Pour toute variable x, nous posons x° — X et x! — x. 


Théorème 1.6.3 Soit f une fonction booléenne à n arguments. Cette fonction est représentée à l’aide de n variables 
X1,...,Xn. Soit À la formule suivante : 


f(a1,.….,an)=1 
Les ai sont des valeurs booléennes et A est la somme des monômes x{\.…..x%" tels que f(ai,...,an) = 1. Par convention, 
si la fonction f vaut toujours 0 alors À = 0. 
Pour toute assignation v telle que v(x1) = a1,...,v(xn) = an, nous avons f(a1,...,an) = [A],. En omettant la distinc- 


tion entre une variable et sa valeur, ce résultat s'écrit plus brièvement : f(x1,...xn) = À. 


Exemple 1.6.4 La fonction maj à 3 arguments vaut 1 lorsqu’au moins 2 de ses arguments valent 1. Nous donnons la 
table représentant cette fonction : 


X1 | 22 | x3 | maj(x1,x2,x3) 

00 0 ) ) ) 0 ) oO) 
0 | O0 | 1 0 0 oO) 0 0 ) 
0 | 1 ) 0 0 0) 0 0 ) 
0 | 1 1 1 1 oO) ) ) 1 
1 0 | 0 0 ) oO) ) 0 0 
1 0 | 1 1 oO) 1 0 0 1 
1 1 oO) 1 ) ) 1 ) 1 
1 1 1 1 0 ) 0 1 1 


Nous notons sur la table de vérité, que chaque monôme ne vaut 1 que sur une ligne de la table et que la somme des 
monômes est équivalente à maj(x1,x2,x3). La fonction maj peut donc s'exprimer par 


1.6.2 Fonctions booléennes et produit de clauses 


Nous effectuons le même raisonnement pour la forme duale. 
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Théorème 1.6.5 Soit f une fonction booléenne à n arguments. Cette fonction est représentée à l’aide de n variables 
X1,...,Xn. Soit À la formule suivante : 


A= I] +.+® 
f(a1,.….,4n)=0 
Les a; sont des valeurs booléennes et À est le produit des clauses aT + …+x® telles que f(a1,...,an) — 0. Par convention 
si la fonction f vaut toujours 1 alors A — 1. 
Pour toute assignation v telle que v(x1) = a1,...,v(x,) = a, nous avons f(a1,...,an) = [A],. En omettant la distinc- 
tion entre une variable et sa valeur, ce résultat s'écrit plus brièvement : f(x1,...,Xn) = À. 


Exemple 1.6.6 Nous représentons la fonction maj définie dans l'exemple [7.6.7 page précédente] par un produit de 


clauses : 


x] | 22 | x3 | maj(x1,x2,x3) 

0 0 0 0 0 1 1 1 0 
0 0 1 0 1 0 1 1 0 
0 1 0 0 1 1 0 1 0 
0 1 1 1 1 1 1 1 1 
1 0) 0 0 1 1 1 0 0 
1 ) 1 Î 1 1 1 1 Î 
1 1 0 Î 1 1 1 1 Î 
1 1 1 Î 1 1 1 1 Î 


La fonction ma j peut donc s'exprimer en produit de clauses comme suit : 


1.7 L'outil BDDC 


BDDC (Binary Decision Diagram based Calculator) est un outil pour la manipulation de formules propositionnelles 
développé par Pascal Raymond et disponible à l’adresse suivante : 


http://www-verimag.imag.fr/-raymond/home/tools/bddc 


Cet outil est une « calculette propositionnelle » basée sur les diagrammes de décision binaires. Ces diagrammes permettent 
d’avoir une représentation interne des formules logiques sous la forme d’un graphe orienté acyclique ayant pour propriété 
d’être canonique. Cette calculette offre notamment la possibilité : 

— d’évaluer si une formule est une tautologie, 

— d'évaluer si une formule a un modèle, 

— de transformer une formule en forme normale conjonctive, 

— de transformer une formule en forme normale disjonctive, 


Ainsi, il est possible d’utiliser BDDC pour résoudre plusieurs des exercices proposés ci-après, parmi lesquels les exercices 
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1.8 Exercices 


Exercice 1 (Formules strictes, formules à priorité) Parmi les expressions suivantes, indiquer celles qui sont et celles 
qui ne sont pas des formules, au sens de la syntaxe stricte décrite dans la définition pag 


1. x 


x= (yA2) 

x= (yAZ)) 
(XV y) 

Cv y)) 

(x = y)V=(A2) 
(x) 


C@Vy) A2) & (u = v))) 


( 
( 
( 
( 
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Ru 
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Exercice 2 (® Formules et priorités) Montrer que toute formule stricte est une formule à priorité. 


Exercice 3 (Formules et priorités) L'arbre suivant représente la structure de la formule ((p A —(p V q)) A -r). 
Â 
Tu 
A L 
TN | 
P = r 
| 
V 
4 D 
P q 


En utilisant les priorités, elle peut s’écrire avec le moins de parenthèses possibles sous l’une des formes : pA-(pVaq)A-r 
avec les notations logiques, p.p + q.r avec les notations booléennes. Comme sur cet exemple, pour chacune des formules 


suivantes, indiquer sa structure sous forme d'arbre, sa forme la moins parenthésée avec les opérations logiques, sa forme 
la moins parenthésée avec les opérations booléennes : 


(-(aAb)& (-aV -b)). 
(-aVb)A(-bV a)). 
((aAb)Ac)V((aA-b)A-c)). 
p=(g—=r)). 

(pæg)= r). 


= 


- ( 
- ( 
Hé 
- ( 


Uù R L& ND 


Exercice 4 (Formules et priorités) /ndiquer sous forme d'arbres, les structures des formules à priorité suivantes : 
LL ps -qVvr. 

pVq—=rA\s. 

pVa=rs. 

pVqAr— =. 


mn OR © D 


pPRrAs—t. 
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6. pVqAsVt. 
7. pAg& =rVs. 
8. —-pAqVr=set. 


Exercice 5 (Hauteur,*) Nous définissons la hauteur h d’une formule à priorité par : 
— h(T)=0erh(Ll)=0. 
— Si A est une variable h(A) = 0. 
— h(-A) =1+h(A). 
— H((A)) = H(A). 
— h(AoB) = max(h(A),h(B)) +1, si o est une des opérations V,A,=,e. 


1. Montrer que cette définition est ambigüe, c’est-à-dire trouver une formule qui peut avoir deux hauteurs différentes. 


2. Proposer une nouvelle définition récursive de la hauteur n'ayant pas ce problème. 


Exercice 6 (Validité) Donner les tables de vérités des formules suivantes : 
LL p=æ(g=p) 
2. pæ(qg—7r). 
3. (pq) (p=r) 
4 par) ={(p—a)= (pr) 


Indiquer celles qui sont valides. Indiquer les équivalences. 


Exercice 7 (®Raisonnement circulaire) Donner les tables de vérité des formules suivantes : a = b, b = c, c = a, 
a&b,b&cetcs a. Conclure que (a b)A(b=c)A(cæa)=(as b)A(b&c)A(ce a). 


Exercice 8 (Équivalence) Donner les tables de vérités des formules suivantes : 
1. pA(pVa). 

PAT. 

(PA). 

(pVa). 

pV(pAa). 

PV. 
7. p. 

Parmi ces formules, indiquer les formules équivalentes . 
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Exercice 9 (Équivalence) Donner les tables de vérités des formules suivantes : 
1. (p=g)\(g= p). 
2. p= q. 
3 p& q. 
4. —q = -p. 
5. (pAg)V(-pA-a). 
Parmi ces formules, Indiquer les formules équivalentes. 


Exercice 10 (Équivalence) Parmi les formules suivantes, indiquer celles qui sont équivalentes à p = qV r ? 
1L q\-r= p. 
2. pA=r— 4. 
3. —qA Tr = —p. 
4 qV-pVr. 
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Exercice 11 (°®Modèle d’un ensemble de formules,*) Montrer qu'une assignation est un modèle d’un ensemble de 
formules, si et seulement si elle est un modèle de la conjonction des formules de l’ensemble. 


Exercice 12 (®Lois de simplification) Prouver que pour tout x, y : 
— xV(XAY)=x. 
— xA(XVy)=x. 

— xV(-xAy)=xVy. 
XA(-xVy)=xAy. 


Exercice 13 (®Simplification de formule,*) Montrer par simplification que la formule suivante est une tautologie. 


(aVb)A(-bVc)= (aVc) 


Exercice 14 (Modèles et formes normales) Soit À la formule suivante : 
(((a= -b)& -c)A(cVd))A(a& d). 


1. À est-elle une tautologie ? (justifier) 
2. A est-elle une contradiction ? (justifier) 
3. Donner la forme normale conjonctive de À (détailler). 


4. Donner la forme normale disjonctive de À (détailler). 


Exercice 15 (®Récurrence,*) Montrer que toute formule construite avec une seule variable, uniquement les connec- 
teurs binaires V et \\ et sans négation est équivalente à une formule de taille 0. 


Exercice 16 (Algèbre de Boole) À l’aide de tables de vérité, indiquer pour les opérations suivantes =,& si elles sont 
commufatives, associatives, idempotentes, transitives. 


Exercice 17 (Algèbre de Boole) Montrer qu'une formule avec une seule variable, notée p, est équivalente à l’une des 
formules, 0,1,p,-p. 


Exercice 18 (Algèbre de Boole) Donner 16 formules telles que toute formule avec deux variables, notées p et q, soit 
équivalente à l’une des 16 formules. 


Exercice 19 (Fonction booléenne) Indiquer en fonction de k combien il y a de fonctions booléennes à k arguments. 


Exercice 20 (Conséquence) Au cours de l'enquête dont il est chargé, l’adjudant Tifrice effectue le raisonnement suivant : 
— Si le meurtre a eu lieu le jour, le meurtrier est l’ami de la victime 
— Or le meurtre a eu lieu la nuit 
Donc le meurtrier n’est pas l’ami de la victime. Le raisonnement de l’adjudant Tifrice est-il correct ? Pour cela nous 
procédons en trois étapes : 


1. Formalisation des faits. 
2. Formalisation du raisonnement permettant de déduire la conclusion à partir des hypothèses. 


3. Démontrer que le raisonnement est correct ou non. 


Exercice 21 (Conséquence) Pinocchio, Quasimodo et Roméo s'apprêtent à chanter en canon. Ils décident entre eux 
que : 


1. Si Pinocchio ne chante pas alors Quasimodo chantera. 
2. Si Quasimodo chante alors Pinocchio et Roméo chanteront. 


3. Si Roméo chante alors Quasimodo ou Pinocchio, l’un des deux au moins, ne chantera pas. 
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Peut-on en conclure que Pinocchio chantera ? Justifier votre réponse en formalisant le raisonnement. 


Exercice 22 (Conséquence) Formaliser les énoncés suivants en dégageant les connecteurs logiques. 
(a) Si Pierre est rentré chez lui, alors Jean est allé au cinéma. 
(b) Marie est à la bibliothèque ou Pierre est rentré chez lui ou les deux. 
(c) Si Jean est allé au cinéma, alors Marie est à la bibliothèque ou Pierre est rentré chez lui ou les deux. 
(d) Marie n’est pas à la bibliothèque et Jean est allé au cinéma. 


(e) Pierre est rentré chez lui. 


Le dernier énoncé est-il conséquence des énoncés qui le précèdent ? 


Exercice 23 (Formes normales) Pour chaque formule donnée ci-après, donner sa forme normale disjonctive et prouver 
si elle est ou non satisfaisable (en donnant si besoin un modèle de la formule). 

— —(a& b)V(bAc)= c. 

— (a=b)A(b= -a)A\(-a= b)A\(b= a). 


Exercice 24 (Formes normales) Soit À la formule pV (gr) & (pVa)A(pVr). Transformer À en une fnc. La formule 
À est-elle valide ? 


Exercice 25 (® Formes normales,**) Nous revenons sur les preuves des transformations en forme normale. 


1. Montrer que l'application de l'élimination des équivalences, des implications et de déplacement des négations sur 
une formule donne une formule en forme normale. 


2. Montrer aussi que quel que soit l’ordre d’application de l’élimination des équivalences, des implications et de 
déplacement des négations sur une formule, l'algorithme de transformation en forme normale termine. 


Exercice 26 (Conséquence et formes normales) L'adjudant Tifrice enquête une nouvelle fois. Ses hypothèses sont les 
suivantes : 

— Si Jean n'a pas rencontré Pierre l’autre nuit, c’est que Pierre est le meurtrier ou que Jean est un menteur 

— Si Pierre n’est pas le meurtrier, alors Jean n’a pas rencontré Pierre l’autre nuit et le crime a eu lieu après minuit 

— Si le crime a eu lieu après minuit, alors Pierre est le meurtrier ou Jean est un menteur. 
Il en conclut que Pierre est le meurtrier. Son raisonnement est-il correct ? Donner la réponse en construisant la conjonc- 
tion des hypothèses et de la négation de la conclusion ef en mettant cette conjonction sous forme de somme de monêômes. 
Nous rappelons que le raisonnement est incorrect si et seulement si un des monômes de la somme ne comporte pas de 
littéraux complémentaires : ce monôême donne un modèle des hypothèses, qui est un contre-modèle de la conclusion. 


Exercice 27 (Formalisation, somme de monômes,*) Nous nous trouvons sur une île dont les indigènes sont répartis en 
deux tribus, les Purs et les Pires. Les Purs disent toujours la vérité tandis que les Pires mentent toujours. Nous rencontrons 
deux indigènes, Aha et Bébéf| 


(a) Aha déclare : « L'un de nous au moins est un Pire ». Pouvons-nous en déduire ce que sont Aha et Bébé ? 
(b) Aha déclare : « L'un de nous deux au plus est un Pire ». Pouvons-nous en déduire ce que sont Aha et Bébé ? 


(c) Aha déclare :« Nous sommes tous les deux de la même tribu ». Pouvons-nous en déduire ce que sont Aha et Bébé ? 


Exercice 28 (Ensemble complet et incomplet de connecteurs.,**) Un ensemble de constantes et de connecteurs est dit 
complet, si toute fonction booléenne est exprimable avec ces constantes et ces connecteurs. D'après le théorème [T.6.3] 


l’ensemble {0,1,—,+,e} est complet. 
1. Montrer que l’ensemble {—,+} est complet. 
Indication : il suffit de montrer que {0,1,e} sont définissables à l’aide de — et +. 


4. Cette énigme provient du livre de Raymond M. Smullyan : « Quel est le titre de ce livre ? », qui contient bien d’autres problèmes amusants à 
propos de ces indigènes. 
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2. Montrer que l’ensemble {0,=} est complet. 


3. Soit | l'opération suivante : x | y est vrai si et seulement si ni l’un, ni l’autre ne sont vrais, autrement dit x | y = 1 


si et seulement si x = 0 et y = 0. Cette opération est aussi appelée ni car x | y est vrai si et seulement si ni x, ni y 
ne sont vrais. 


Montrer que cette opération est complète. 
(**) Montrer que l’ensemble {0,1,+,e} est incomplet. 


Indication : nous trouvons une propriété caractéristique des fonctions booléennes définies avec ces opérations et 
qui n’est pas vérifiée par toute fonction booléenne. 


Nous appelons monotone, une fonction f telle que si ai < b1,...an <b, alors f(ai,...an) < f(b1,...bn). 
Montrer que toute fonction booléenne définie avec {0,1,+,e} est monotone. 

Proposer une fonction booléenne non monotone. 

(*) L'ensemble {1,=} est-il complet ? 

(**) L'ensemble {0,&} est-il complet ? 


Exercice 29 (®Dualité, récurrence,**) Considérons des formules dont les opérations sont limitées à 0,1,-,A,V. Nous 
rappelons que la formule duale d’une formule est obtenue en échangeant les conjonctions et les disjonctions ainsi que les 
0 et les 1 et que nous notons A* la duale de la formule A. 


1: 


2: 


Montrer que si 2 formules sont équivalentes, il en est de même de leurs duales. Nous donnons une indication qui 
réduit la question à une récurrence simple. Soit v une assignation. Soit v l’assignation complémentaire de v : pour 


toute variable x, V(x) = v(x). Par exemple l’assignation complémentaire de a = 1,b—0esta=0,b=1. 


(a) Montrer que pour toute formule À : [A*], = [AÏ;. 
(b) En déduire que si 2 formules sont équivalentes, il en est de même de leurs duales. 


En déduire que si une formule est valide, sa duale est contradictoire. 


Exercice 30 (Représentation canonique,***) Soit x0<;<,) une liste de n variables distinctes. Dans cet exercice, les 
variables des formules sont toutes dans cette liste. À cette liste et à une formule À, nous associons la fonction booléenne 


f à n arguments définie par f(x1,...,Xn) = À. Cette notation signifie que pour a1,...an € B, la valeur de f(a1,...,a) est 
la valeur de la formule À quand x1 = a1,...,Xn = 4n. 
1. Combien y a-t-il de classes de formules ? 


2} 


Notons par ® le ou-exclusif. Nous avons x@ y = 1 si et seulement soit x = 1, soit y = 1 mais pas x =y=l 
(d’où le nom de ou-exclusif). Nous pouvons aussi définir cette opération par x ® y = -(x & y). Il est clair que 
cette opération est commutfative, associative, que l'opération \ est distributive sur & et que 0 est l’élément neutre 
de &. Exprimer la négation, la disjonction, l'implication et l’équivalence comme somme ou-exclusive de 1 et de 
conjonctions de variables. 


Montrer que toute formule booléenne est équivalente à une somme ou-exclusive de I et de produits de variables. 


4. Par convention 1 est considéré comme le produit de zéro variable et 0 comme la somme ou-exclusive de zéro 


produit de variables. Montrer que toute formule booléenne est équivalente à une somme ou-exclusive de produits 
dont les ensembles de variables sont tous distincts. 


Fixons un ordre arbitraire des n variables utilisées dans les formules (lorsque les variables sont des identificateurs, 

cet ordre est souvent l’ordre lexicographique). Une somme ou-exclusive de produits de variables est canonique 

(forme de Reed-Muller) si et seulement si : 

— ses produits ne comportent pas de variables répétées et dans un produit les variables sont ordonnées de gauche 
à droite dans l’ordre croissant, 

— les produits sont ordonnés de gauche à droite dans l’ordre lexicographique décroissant déduit de l’ordre des 
variables. 

Montrer que toute formule booléenne est équivalente à une somme ou-exclusive canonique. En déduire l’unicité 

de cette forme canonique. 
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Chapitre 2 


Résolution propositionnelle 
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| ES tables de vérité et les transformations en sommes de monômes ou produits de clauses permettent de répondre 

aux questions : une formule est-elle valide ? et un raisonnement est-il correct ? Cependant le temps de réponse de 

ces méthodes augmente exponentiellement avec le nombre de variables. Pour illustrer cela, considérons la conséquence 
suivante : 


a=b,b=cc=dd—=ee—f,f-=gg-=hh=ii= jhka= )j 


En utilisant une table de vérité il faut tester 21° — 1024 lignes. Or par déduction, en utilisant la transitivité de l’im- 
plication, nous savons immédiatement que le raisonnement ci-dessus est correct. Aïnsi, en logique propositionnelle, les 
déductions peuvent s’avérer très utiles, voire nécessaires lorsque la taille du problème à traiter est importante. Nous étu- 
dions maintenant un système de déduction très simple. Dans ce système, les hypothèses et les formules déduites ne sont 
pas des formules quelconques mais des clauses, c’est-à-dire des disjonctions de littéraux. De plus, le système comporte 
une seule règle appelée /a résolution. 


Plan : Nous introduisons d’abord la méthode de résolution inventée en 1965 par J. Alan Robinson dans le cadre 
plus général de la recherche de preuve au premier ordre. Nous présentons ensuite une procédure pour calculer tous les ré- 
solvants possibles, c’est-à-dire toutes les applications possibles de la règle de résolution : la stratégie complète. Puis, nous 
étudions l’algorithme DPLL, proposé dans les années soixante par Martin Davis, Hilary Putnam, George W. Logemann et 
Donald W. Loveland [0|O]. En utilisant la notion de résolution, des méthodes de simplifications et le branchement/retour 
arrière, cet algorithme prouve efficacement si une formule a un modèle ou non. Bien qu’inventé il y a plus de quarante 
ans, il est toujours à la base de la plupart des solveurs SAT complets actuels. Notons que dans ce chapitre nous adoptons 
la notation booléenne plus concise. 
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2.1 Résolution 


Nous souhaitons prouver que a+ c est une conséquence de a+bet b+c, c’est-à-dire a+b, b+ca+c. En utilisant 
la propriété [1.2.2 page 17 il suffit de démontrer que la formule (a +b).(b+c) = (a+c) est valide. Pour cela, nous 
pouvons utiliser une table de vérité (8 lignes) ou alors une simplification de formules comme dans l’exercice[T3 page 33] 
Ces deux méthodes sont fastidieuses même pour des formules aussi simples (3 variables uniquement). En utilisant la règle 
de résolution présentée dans ce chapitre, nous déduisons directement la clause a + c à partir des deux clauses a +b et 
b+c. 

Nous donnons maintenant la définition de la résolution et certaines propriétés utiles qui en dérivent. Nous prouvons 
ensuite la cohérence et la complétude pour la réfutation de notre système basé sur la déduction. La cohérence nous permet 
d'affirmer que si une clause C est obtenue par résolution à partir d’un ensemble T° de clauses alors elle en est conséquence, 
c’est-à-dire tout modèle de I” est modèle de C. La complétude pour la réfutation nous permet d’affirmer que si L est 
conséquence de l”, autrement dit si L est insatisfaisable, alors L peut être retrouvé par résolution à partir de T°. 


2.1.1 Définitions 


Dans un premier temps nous introduisons les notions nécessaires à la définition de la résolution. Nous rappelons 
que les notions de clauses et littéraux sont définies dans la section [T.4]du chapitre précédent (page CE: Comme nous le 
verrons dans la suite deux clauses qui ont le même ensemble de littéraux jouent le même rôle dans la résolution. Aussi, 
nous définissons deux clauses égales comme étant deux clauses avec le même ensemble de littéraux. 


Définition 2.1.1 (Éléments d’une clause, clauses égales et sous-clauses) 
— Un littéral est élément d’une clause, s’il est élément de l’ensemble des littéraux de la clause. 
— Une clause À est incluse dans une clause B, si tous les littéraux de la clause À sont éléments de la clause B. Dans 
ce cas, À est une sous-clause de B. 
— Deux clauses sont égales si elles ont le même ensemble de littéraux. 


Exemple 2.1.2 Nous illustrons les notions introduites par des exemples simples : 
— Le littéral p est élément de la clause q + p +r + p. 
— La clause p + est incluse dans la clause q + p +r + p. 
— Enlever le littéral p de la clause q + p +r + p donne la clause q +r, enlever le littéral p de la clause p + p+p 
donne la clause I. 
— Ajouter le littéral r à la clause p donne la clause p +r, ajouter le littéral p à la clause L donne la clause p. 
— Les clauses p +3 ÿ+p, et p+q+p sont égales. 


Notation : Nous notons s(A) l’ensemble des littéraux de la clause À. Par convention L est la clause vide et s(_L) — 0. 
Exemple 2.1.3 s(9+p+r+p+p)={qp;rp}. 
Dans l'exercice [37 page 53]nous demandons de formaliser ce qu’est une clause et son ensemble de littéraux. Nous 


introduisons la notion de littéral complémentaire, noté L° pour un littéral L, afin de manipuler dans nos raisonnements 


uniquement des littéraux. En effet, la négation ne suffit pas car L est équivalent à L mais n’est pas un littéral : un littéral 
est une variable ou la négation d’une variable mais la double négation d’une variable n’est pas un littéral. 


Définition 2.1.4 (Littéral complémentaire) Notons L' le littéral complémentaire d’un littéral L, défini par : 
— Si L est une variable, L° est la négation de L. 
— Si L est la négation d’une variable, L° est obtenue en enlevant la négation de L. 


Exemple 2.1.5 x° =x et x° = x. 
Nous présentons le calcul de résolvant entre deux clauses, ce qui constitue l’unique règle du système de résolution. 


Définition 2.1.6 (Résolvant) Soient À et B deux clauses. La clause C est un résolvant de A et B si et seulement s’il y a 
un littéral L tel que LE s(A), L° € s(B) et s(C) = (s(A) — {L})U (s(B) — {L°‘}). Nous utilisons la représentation suivante 
lorsque C est un résolvant de À et B : 
A B 
C 
Si la clause C est un résolvant de A et B, alors nous disons que C est engendrée par À et B, et que À et B sont les 
parents de la clause C. 
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Exemple 2.1.7 Nous proposons quelques exemples de résolution : 


Propriété 2.1.8 Si l’un des parents d’un résolvant est valide, le résolvant est valide ou contient l’autre parent. 


Preuve : Cette preuve est demandée dans l’exercice[39 page 33] 


Étant données deux clauses À et B, la formule À + B n’est pas une clause si l’un des deux opérandes de la disjonction 
est la clause vide. Par exemple L + p n’est pas une clause, bien que les deux opérandes de la disjonction soient des clauses. 
Aussi nous introduisons un nouvel opérande, +, afin de combiner la disjonction et l’élimination de L. Cet opérande va 
nous permettre de simplifier la définition de résolvant. 


Définition 2.1.9 (C+D) Soient C et D deux clauses. Nous notons C+D la clause suivante : 
— SiC= 1 alors CFD =D, 
— sinon si D = L alors C+D = C sinon C+D =C+D. 


Ajouter le littéral L à la clause C, c’est construire CFL. Munis de cette définition, nous pouvons reformuler plus 
simplement la règle de résolution. 


Définition 2.1.10 (Résolvant) Soient À et B deux clauses. La clause C est un résolvant de À et B si et seulement s’il y a 
un littéral L tel que : 
— L est élément de la clause À, L° est élément de la clause B 
— C'est égale à la clause A'+B' où A’ = À — {L} est obtenue en enlevant L de A et B' = B — {L°} est obtenue en 
enlevant L° de B. 


La combinaison de résolutions successives permet de générer de nouvelles clauses. Une clause issue de ces résolvants 
sera une preuve par résolution de cette clause à partir d’un ensemble de clauses. 


Définition 2.1.11 (Preuve) Soient Lun ensemble de clauses et C une clause. Une preuve de C à partir de TV est une liste 
de clauses qui se termine par C. Toute clause de la preuve est égale à un élément de V ou est un résolvant de deux clauses 


la précédant dans la preuve. La clause C est déduite de Y°, notée VC, s’il y a une preuve de C à partir de T.. 


Exemple 2.1.12 Soit l' l’ensemble de clauses p+q,p+q,p+@,p +. Nous montrons que TE L par la preuve suivante : 
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Nous pouvons aussi voir une preuve comme un arbre dont les feuilles sont les hypothèses et dont les sommets internes 
sont obtenus par construction des résolvants. 


Définition 2.1.13 (Taille de preuve) Une preuve P de C à partir d’un ensemble de clauses Test de taille n si elle contient 
n lignes. 


La taille de la preuve donnée dans l’example P.T.T7 page précédentelest 8, ce qui n’est pas forcément intuitif sur la 


représentation en arbre. Nous utiliserons les deux propriétés énoncées ci-dessous souvent de manière implicite dans les 
preuves. 


Propriété 2.1.14 (Monotonie et composition) Soient T, À deux ensembles de clauses et À, B deux clauses. 
1. Monotonie de la déduction : SiT + À et si T est inclus dans À alors At A 
2. Composition des déductions : SiT + A, l'E B et si C est un résolvant de À et B alorsT' KC. 


Preuve : Demandée dans l’exercice [58 page 


2.1.2 Cohérence 


La cohérence de la résolution signifie que si une clause C est obtenue après une à plusieurs applications de la règle de 
résolution à un ensemble de clauses alors tout modèle de IL” est aussi modèle de C (autrement dit, C est une conséquence 
de T”). La première partie de la preuve consiste à démontrer la cohérence d’une application de la règle de résolution 
(théorèmefZ.T. T3]. Nous généralisons ensuite par induction dans le théorème 


Théorème 2.1.15 (Cohérence de la règle de résolution) Si C est un résolvant de À et B alors A,BE C. 


Preuve : Supposons que C soit un résolvant de À et B. Par définition il y a un littéral L tel que L € s(A),L° € s(B),s(C) = 
(s(A) — {L})U(s(B) — {L°}). Soit v une assignation modèle de À et B, c’est-à-dire, [A], = 1 et [B], = 1. Montrons que v 
est modèle de C. Nous distinguons deux cas possibles : 
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Théorème 2.1.16 (Cohérence de la déduction) Soient L'un ensemble de clauses et C une clause. SiTHC alors T EC. 


Preuve : Supposons que l'H C. Par définition, il existe une preuve P de C à partir de I”. Supposons que pour toute preuve 
de D à partir de T°, plus courte que P, nous avons L } D. Montrons que LH C. Nous avons deux cas possibles : 


Corollaire 2.1.17 D'après le théorème[2.T.16] sil É L alors TE L, autrement dit Test insatisfaisable. 


2.1.3 Complétude pour la réfutation 


La complétude pour la réfutation est la propriété suivante : si [est un ensemble insatisfaisable de clauses, alors il y a 
une preuve de la clause vide à partir de I. Nous montrons dans la suite de cette section la complétude pour la réfutation 
lorsque Test un ensemble fini de clauses. 

Nous prouvons la complétude réfutationnelle par récurrence sur le nombre de variables. Pour cela, nous construisons 
à partir de L° deux ensembles de clauses contenant tous deux une variable en moins. Plus précisément, nous construisons 
les ensembles l'[L := 1] et I'[L := 0] en assignant un littéral L de T° à vrai et à faux, respectivement. Nous étudions ensuite 


les propriétés de ces deux ensembles par rapport à I” (lemmes[2. 1.22 page suivantelet{2. 1.23 page suivante}. Ces propriétés 


seront utilisées lors du pas de récurrence. 


Définition 2.1.18 (T[L:= 1]) Soient Lun ensemble de clauses et L un littéral. V[L := 1] est l’ensemble de clauses obtenu 
en supprimant les clauses dont L est élément et en enlevant L° des autres clauses. Nous posons T'[L := 0] = TL := 1]. 


T'[L := x] est égal à l’ensemble de clauses obtenu en donnant à L la valeur x (x = 0 ou x = 1) et en simplifiant le résultat 
obtenu. 


Exemple 2.1.19 Soit l l’ensemble de clauses bp +q,q+r, p+q,p +r. Nous avons : 
— [p:=il= 


Afin de donner une intuition de comment calculer T[p := 1] et T'{p := 0], nous considérons le produit de clauses suivant 


(p+a)(q+ r)(p +q)(p +r) et observons : 
— (+g)@q+r)(+ag)(+r) = 


— (0+g)(g+r)(0+g)(0+r) = 
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Nous notons v[L := 1] l’assignation qui donne à L la valeur 1, à L° la valeur 0 et ne change pas la valeur des autres 
littéraux. 


Définition 2.1.20 (v[L :— 1]) Soit une assignation v, l’assignation v[L := 1] est l’assignation identique à v sauf éventuel- 
lement pour x la variable de L. Si L = x alors v[L := 1](x) = 1, si L =% alors v[L:= 1](x) = 0. 


Nous posons v[L := 0] = v[L' := 1]. La propriété suivante se déduit du fait que si F a un modèle v, alors v donne soit la 
valeur 1 soit la valeur 0 au littéral L. 


Propriété 2.1.21 Soient L'un ensemble de clauses et Lun littéral. V a un modèle si et seulement siT[L := 1] ou T'[L:=0] 
a un modèle. 


Lemme 2.1.22 Soient T un ensemble de clauses, C une clause et L un littéral. SiT[L:=1]+C alors THCouT+C+Le. 
Rappel : L'opération + est introduite dans la définition|2.1.9 page 39 
Lemme 2.1.23 Soient T un ensemble de clauses, C une clause et L un littéral. SiT'[L:=0]HC alors T'HCouT+HC+L. 


Preuve : Supposons l'[L := 0] + C. Puisque l'[L := 0] = T'[L° := 1] et que L‘° = L, d’après le lemme nous avons 
TECour+CEFL. 


Théorème 2.1.24 Soit L'un ensemble fini de clauses. SiT est insatisfaisable alors TH L. 


Preuve : Supposons que l'est insatisfaisable. Soit n le nombre de variables de I”. Nous montrons que l'H L par récurrence 
sur n. Supposons que pour tout ensemble A de clauses insatisfaisable avec moins de n variables, nous avons AH L. 


Cas de base : Supposons que n soit nul. Donc I = @ ou l = {1}. Le premier cas est impossible, car l’ensemble vide 
est valide (toute assignation en est modèle). Donc L = {L} et par suite TH L. 

Induction : Supposons que n soit non nul. Soit x une variable figurant dans [”. D’après la propriété[2.1.21] Tfx :=0] et 
l'fx:= 1] sont insatisfaisables. Puisque la variable x ne figure pas dans ces deux ensembles de clauses, l'hypothèse 
de récurrence s’applique, donc : Ffx:=0]H Letlfx:=1]H L. Des lemmes L.1.22]etf2.1.23] nous déduisons soit 
THl,soitl'+xet l'E x. Dans le premier cas, la preuve est terminée. Dans le deuxième cas, puisque L est un 
résolvant de x et x, nous avons également l'+ 1. 


Corollaire 2.1.25 Soit Lun ensemble fini de clauses. Test insatisfaisable si et seulement siTH L. 


Preuve : Ce corollaire est une conséquence immédiate du lemme ci-dessus et de la remarque faite au début du para- 


graphe [TT pare précédent] 


2.14 Réduction d’un ensemble de clauses 


Réduire un ensemble de clauses, c’est lui enlever les clauses valides et les clauses contenant une autre clause de 
l’ensemble. Un ensemble de clauses est réduit s’il n’est plus réductible. 


Définition 2.1.26 (Ensemble de clauses réduit) Un ensemble de clauses est réduit s’il ne contient aucune clause valide 
et aucune clause n'est incluse dans une autre clause. 


Exemple 2.1.27 La réduction de l’ensemble de clauses {p+q+p,p+r,p+r+5,r+q} donne l’ensemble réduit : 


Propriété 2.1.28 Un ensemble de clauses E est équivalent à l’ensemble de clauses réduit obtenu à partir de E. 


Preuve : 
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2.2 Stratégie complète 


Pour savoir si un ensemble fini [de clauses est contradictoire, il y a une méthode simple mais peu efficace : construire 


toutes les clauses que nous pouvons déduire de I”. D’après le corollairel2.1.25 page ci-contre| l'est contradictoire si et 


seulement si la clause vide a été construite. Il faut préciser ce que nous entendons par construire toutes les clauses déduites 
de I°. Si nous considérons comme différentes les clauses qui s’écrivent différemment, deux clauses ont une infinité de 
résolvants. Par exemple les clauses p +g et r +g ont comme résolvants la clause p+r mais aussi les clauses r + p, p+r+p, 
P+...+p+r+::.+7r. Donc l’ensemble des clauses déduites de Fest infini. Aussi, il faut, comme précédemment, 
considérer comme égales deux clauses, qui ont le même ensemble de littéraux (voir définition. T.T page 38) : avec cette 
définition de l'égalité de deux clauses, V ensemble des résolvants de deux clauses est fini ainsi que l’ensemble des clauses 
déduites de IL”. Supposons que l’ensemble des littéraux de Lait n éléments, comme les clauses déduites de I ne comportent 
que des littéraux de F (voir exercice [40 page 33}, il y a donc au plus 2” clauses déduites de T°. Pour simplifier la suite, 
comme ci-dessus, nous confondons une clause et son ensemble de littéraux. 


2.2.1 Algorithme de la stratégie complète 


Soit L'un ensemble de clauses. Pour obtenir l’ensemble des clauses minimales déduites de I”, on construit deux suites 
d’ensembles de clauses A;;>0) et @;(;>0) en s’arrêtant au premier indice k tel que A4 — 0. 


1. Ab est obtenu en réduisant Let ®n est l’ensemble vide. 
2. A;,. est obtenu de la façon suivante 


(a) Nous construisons l’ensemble des résolvants entre les clauses de A; et celles de A;UO; puis nous réduisons cet 
ensemble. 


(b) Nous enlevons de cet ensemble de résolvants, les clauses qui contiennent une clause de A;UO,;. 
3. @;:, est obtenu en enlevant de l’ensemble A;U O; les clauses qui contiennent une clause de A;,1. 
Nous illustrons notre algorithme par deux exemples. 


Exemple 2.2.1 Nous appliquons l'algorithme à l’ensemble de clauses a+b+ä,a+b,a+b+c,a+b,a+b,a+b. L'al- 
gorithme effectue alors le calcul suivant. L'ensemble As comprend les clauses : 


a+b 
a+b 
aä+b 
a+b 


KR & ND 


L'ensemble Oo est vide. L'algorithme calcule les résolvants non valides suivants : 


résolvant de 1 et 2 
résolvant de I et 3 


résolvant de 2 et 4 


NN À Un 
SISRSEES 


résolvant de 3 et 4 


Donc l’ensemble Ai comprend les mêmes clauses que nous numérotons de 5 à 8. 
L'ensemble ®\ est vide. 
L'ensemble À; comprend la clause : 


9 JL deSets8 


Car l'algorithme obtient deux fois L. 
L'ensemble ®; est vide. 
L'ensemble A3 est vide. 
L'ensemble O3 est égal à Az. 
Nous notons que l'algorithme a construit la preuve suivante : 
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© Co R © Uni ND 


a+b 
a+b 
a résolvant de I et 2 
a+b 
a+b 
a résolvant de 3 et 4 


résolvant de 5 et 8 


Nous pouvons utiliser la représentation ci-dessous sous forme de tableau représentant la construction de ces en- 


sembles. 


av 


O4 


A; UOz 


Résolvants de A4 et AU @z 


3 


Comme le montre cet exemple, les clauses de A; ont des preuves de hauteur i, et celles de @; des preuves de hauteur 


inférieure à c. 


Exemple 2.2.2 L'application de la stratégie complète sur l’ensemble {a,c,a+b,c+e} nous donne l’ensemble {a,c,e,b}. 


AY: 


O4 


A;U@% 


Résolvants de Az et A; U@+ 


NIMES 


Nous montrons que l’algorithme se termine et qu’il est correct, c’est-à-dire que l’ensemble @; est l’ensemble des 
clauses minimales déduites de 1°. l’est insatisfaisable si et seulement si la clause vide est élément de O4. 


2.2.2 Arrêt de l’algorithme 


Soit n le nombre de littéraux de I”. Les clauses éléments des A; sont des clauses déduites de [”, donc, comme nous 
l’avons rappelé ci-dessus, elles ne comportent que des littéraux de I”. Par suite, l’ensemble [;., A; comprend au plus 2” 
clauses. D’après l’algorithme, les ensembles A; sont non vides pour i < k. Nous montrons ci-dessous que ces ensembles 
sont disjoints. Par conséquent k < 2” + 1, autrement dit l’algorithme s’arrête. 


Propriété 2.2.3 Soit i < k. Toute clause de Ü;<;A; contient une clause de A; UO;:. 


Preuve : Nous effectuons une preuve par induction. 
— Pour i = 0 la propriété est triviale car Ü<o À; = Ao et A;U®; = A (@o = 0). 
— Supposons la propriété vraie au rang i et montrons qu’elle reste vraie au rang i+1. Soit C EU <;,1 A;. Montrons 
que C contient une clause de A;,1 U@;1. Nous examinons tous les cas possibles pour C. 


1. CE A;,1. Donc C contient une clause de A;,,U@;:1. 


2. CEU;<;A;. Par hypothèse de récurrence, C contient une clause D € A;U@;. Nous distinguons deux situations 


pour D. 


(a) DE @;,1. Donc C contient une clause de A;,1 U@;:1. 


() D & O;;1. Par construction de @;,1, puisque D € A;Ü@); et que D & @;,1, c’est que D contient une clause 
de A;,1. Or C contient D, donc C contient aussi une clause de A;,,UO;,1. 


Propriété 2.2.4 Pour tout i < k, les ensembles À; sont disjoints entre eux. 
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Preuve : Nous effectuons une récurrence sur les ensembles A; avec 0 < j <ieti<k. 
Cas de base : Sii = 0, il n’y a qu’un seul ensemble, donc la propriété est vérifiée. 


Récurrence : Soit i < k. Supposons que tous les ensembles A; où j < i sont disjoints entre eux. 
Montrons que A;. est disjoint de ces ensembles. 
Soit C € A1. Supposons, au contraire, que C EU ;<;A;. D’après la propriété précédente, C inclut une clause de 
A;U6;. Donc par construction de A;}1,C & À;;1, contradiction. Par suite, C & JS A5. 


2.2.3 Le résultat de l’algorithme est équivalent à l’ensemble initial de clauses 


Nous montrons ci-dessous que l’ensemble ®; est équivalent à I". 
Propriété 2.2.5 Pour tout i < k, les ensembles A;UO; et A;:1U@;;1 sont équivalents. 


Preuve : 


1. Toute clause de A;, , UO@;,, est conséquence de A;UO;. En effet toute clause de A;, , UO;, , est élément de A;UO; 
ou résolvant de deux éléments de cet ensemble, donc est conséquence de cet ensemble. 


2. Toute clause de A;UO@); est conséquence de A;,1U@;,1. Soit C € A;UO®;. Nous distinguons deux cas possibles : 


(a) CE @;,1, ainsi C est conséquence de A;,, U@;,1. 


(b) C£ @;,1, ainsi C contient une clause de A;,, donc est conséquence de A;,1 U@;:1. 


Propriété 2.2.6 Les ensembles T et O4 sont équivalents. 


Preuve : Par définition As est l’ensemble obtenu par réduction de 1”, d’après la propriété ces deux 
ensembles sont équivalents. Puisque @, est vide, l'est équivalent à A5 U ©. D’après la propriété [2.2.5|et par récurrence, 
Ao U @ est équivalent à l’ensemble de clauses A; U @4. Puisque l’algorithme termine quand A+ est l’ensemble vide, les 
ensembles l'et @4 sont équivalents. 


2.3 Algorithme de Davis-Putnam-Logemann-Loveland 


La méthode de Davis-Putnam-Logemann-Loveland (DPLL) fut crée en 1960 par Martin Davis et Hillary Putnam, puis 
améliorée en 1962 par Martin Davis, George Logemann et Donald Loveland. L’algorithme DPLL permet de décider si un 
ensemble de clauses est satisfaisable. Bien que cet algorithme date de plus de 50 ans, de nombreuses variantes en sont 
encore étudiées, car il est bien meilleur que ceux précédemment étudiés (table de vérité, transformation en somme de 
monômes ou produit de sommes, stratégie complète). Nous remarquons d’abord qu’il y a deux types de transformations 
de formules : 


1. Celles qui préservent le sens, c’est-à-dire transforment une formule en une autre formule équivalente. 


2. Celles qui préservent seulement la satisfaisabilité, c’est-à-dire transforment une formule satisfaisable en une autre 
formule satisfaisable. 


L'efficacité de l’algorithme DPLL vient de l’utilisation des transformations préservant seulement la satisfaisabilité, car ces 
transformations sont moins coûteuses que celles préservant le sens. Nous introduisons d’abord la suppression des clauses 
contenant des littéraux isolés, puis la résolution unitaire et enfin la simplification des clauses valides. Ces transformations 
constituent les briques de base de l’algorithme DPLL. L'idée principale de cet algorithme, partant d’un ensemble de clauses 
«irréductibles », est de choisir une variable et de considérer les deux situations possibles : le cas où elle est vraie et le cas 
où elle est fausse. Ainsi les deux ensembles de clauses obtenus peuvent éventuellement se simplifier, sinon le choix d’une 
nouvelle variable est nécessaire. Dans le pire des cas il s’agit de construire la table de vérité correspondante aux clauses, 
mais en pratique de nombreuses simplifications apparaissent et permettent à cet algorithme de conclure efficacement. 
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2.3.1 Suppression des clauses contenant des littéraux isolés 


Comme nous ne cherchons pas à préserver l’équivalence de formule mais la satisfaisabilité, nous avons la liberté de 
choisir la valeur de certaines variables. En particulier une variable qui n’apparaît que sous la forme d’un littéral positif 
ou négatif sera dite isolée. Nous pouvons alors affecter la valeur adéquate à cette variable afin de rendre vraies toutes les 
occurrences du littéral associé, ceci sans changer la satisfaisabilité de l’ensemble de clauses considéré. 


Définition 2.3.1 (Littéral isolé) Soient T un ensemble de clauses et L un littéral élément d’une clause de Y,, L est un 
littéral isolé (relativement à T), si aucune clause de T ne comporte de littéral complémentaire de L. 


Lemme 2.3.2 La suppression des clauses qui comportent un littéral isolé, préserve la satisfaisabilité. 


La preuve est demandée dans l’exercice 9 page 54 


Exemple 2.3.3 Soit L l’ensemble de clauses {p+q+r,q+r,q+s,s+t}. 


2.3.2 Résolution unitaire 


Définition 2.3.4 Une clause unitaire est une clause qui ne comporte qu'un littéral. 


Les clauses unitaires sont aussi des clauses particulières qui sont : 
— soit isolées et donc seront traitées par la simplification précédente, 
— soit de potentiels résolvants, dans ce cas il faut effectuer la résolution dite « unitaire » de ces clauses. 


Lemme 2.3.5 Soit L'un ensemble de clauses. Soit L l’ensemble des littéraux des clauses unitaires de T. Soit © l’ensemble 
de clauses ainsi obtenu à partir de T : 
— Si L comporte deux littéraux complémentaires, alors @ = {1}. 
— Sinon © est obtenu ainsi : 
e Nous enlevons les clauses qui comportent un élément de L. 
e À l’intérieur des clauses restantes nous enlevons les littéraux complémentaires des éléments de L. 
l'a un modèle si et seulement si ® en a un. 


La preuve est demandée dans l’exercice[50 page 54] 


Exemple 2.3.6 
— Soit T l’ensemble de clauses : p+q,Dp,q. 


— Soit T l’ensemble de clauses : a+b+d,a+c+d,b,d,c. 


2.3. Algorithme de Davis-Putnam-Logemann-Loveland 47/129 


— Soit T l’ensemble de clauses : p,q,p+r,p+rq+r,q+s. 


2.3.3 Suppression des clauses valides 


Enfin la dernière transformation utilisée dans l’algorithme DPLL est de simplement enlever les clauses valides d’un 
ensemble de clauses. Ceci peut paraître une évidence mais cette transformation est une des idées centrales de cet algo- 
rithme, une fois une variable affectée à une valeur, elle est implicitement utilisée dans la suppression de clauses contenant 
des littéraux isolés. 


Lemme 2.3.7 Soit lun ensemble de clauses. Soit © l’ensemble de clauses obtenu en supprimant les clauses valides de 
LI. l'a un modèle si et seulement si ® en a un. 


Preuve : 


— Supposons que [a un modèle v, comme © est un sous-ensemble des clauses de 1”, v est aussi modèle de @. Donc, 
® a un modèle. 

— Supposons que ® a un modèle v. Soit v’ une assignation de l telle que v'(x) = v(x) pour toute variable x présente 
à la fois dans Let ©. Soit C une clause de I. Si C est aussi une clause de ©, alors v’ est un modèle de C car v et v’ 
donnent la même valeur à C. Si C n’est pas une clause de ©, alors C est valide, en conséquence toute assignation, 
v' en particulier, est modèle de C. D’où, Fa un modèle : v’. 


2.3.4 [L’algorithme 


Nous donnons une version de l'algorithme DPLL dans la figure[2.T page suivante]dans la fonction Algo_DPLL. Nous 
pouvons constater dans l’algorithme que nous supprimons une seule fois les clauses valides avant de réellement commen- 
cer les simplifications. Cela se justifie par le fait que l’algorithme ne pourra pas produire de nouvelles clauses valides. 
En effet, 1l ne fait qu’enlever des littéraux des clauses initialement données. Par suite, il est inutile d’enlever des clauses 
valides lors de l’étape de réduction, puisqu'il n’y aura plus de telles clauses. La fonction DPLL teste d’abord si la clause 
vide a été générée, puis effectue les simplifications possibles avant de choisir une variable pour appliquer récursivement 
la même fonction dans le cas où cette variable est affectée à vraie et dans le cas où elle est affectée à faux. 


Pour obtenir une trace de l’algorithme, nous supprimons les clauses valides, en abrégé VAL, puis nous dessinons 
l’arbre des appels avec l’argument de la fonction ainsi que les ensembles obtenus par les étapes 2 (réduction, en abrégé 
RE), 3 (enlèvement des clauses ayant des littéraux isolés, en abrégé ELIT) et 4 (résolution unitaire, abrégé en RU). À cause 
du « ou alors », il est inutile de poursuivre la construction de cet arbre dès que la réponse vrai (attachée à un ensemble vide) 
a été obtenue. Dans ce cas, un modèle peut être exhibé en remontant la récursion, en tenant compte des simplifications : 
le modèle doit rendre vrai chaque littéral isolé ou clause unitaire trouvé. 


Exemple 2.3.8 Nous illustrons l'application de cet algorithme sur deux ensembles de clauses. 


— Soit T l’ensemble de clauses : äà+b,a+b,a+t,a+c,b+c,b+c. Nous donnons la trace de l'algorithme. 
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bool fonction Algo_DPLL( T°: ensemble de clauses) 
O0 Supprimer les clauses valides de T°. 


Si I — 0, retourner (vrai). 
Sinon retourner (DPLL(1')) 


bool fonction DPLI( [° : ensemble de clauses non valides) 
La fonction retourne vrai si et seulement si l'est satisfaisable 


1 Silel, retourner(faux). 
Si I — 0, retourner (vrai). 


Réduire L”: il suffit d’enlever toute clause contenant une autre clause. 


2 
3 Enlever de T les clauses comportant des littéraux isolés (cf. paragraphel2.3.1 page 46). 


Si l’ensemble l'a été modifié, aller en 1. 

4 Appliquer à [ la résolution unitaire (cf paragraphe P.3.2 page 46}. 
Si l’ensemble TL” a été modifié, aller en 1. 

5 Choisir x une variable quelconque de F° 
retourner (DPLL(T [x := 0]) ou alors DPLL(T [x := 1])) 


FIGURE 2.1 - Algorithme de Davis-Putnam-Logemann-Loveland. 


— Soit T l’ensemble de clauses : p+q,p+5,p+q,p +5. Nous donnons la trace de l'algorithme. 


P+9,p,p +q 


RE 
PP 
ELI : q=1 


ELI:p=0 


P 


+q 


(] 


P+g,p+s,p+q,p+s 


Puisqu'une feuille porte l’ensemble vide, l’ensemble Test satisfaisable. Il est inutile de poursuivre la construction 
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de la branche droite. 


Théorème 2.3.9 L'algorithme Algo_DPLL est correct. 


Preuve : La réduction et les transformations P.3.7 page 46et préservent l’existence d’un 


modèle, donc au pas 0 et 1, l’algorithme vérifie l’invariant suivant : la valeur courante de l’ensemble de clauses de l'a un 
modèle si et seulement si I a un modèle. Nous en déduisons immédiatement que les réponses de l’algorithme, fournies 
au pas 0 ou 1, sont correctes. Au pas 5, pour les mêmes raisons, la valeur courante de l’ensemble de clauses de F”, lors de 
l’appel de DPLL, a un modèle si et seulement si I” a un modèle. Supposons les appels récursifs corrects : 

— Si DPLL(T {x := 0]) est vrai, par récurrence l'[x := 0] est satisfaisable donc T° est satisfaisable (nous utilisons le 
résultat : Fest satisfaisable ssi L'{x := 0] est satisfaisable ou Lx := 1] est satisfaisable), ce qui 
correspond à la valeur vrai de DPLL(T). 

— Si DPLLT fx := 0]) est faux, par récurrence [x := 0] est insatisfaisable. Dans ce cas, DPLL(T) vaut DPLL(T [x := 1]): 
— Supposons que DPLL(T [x := 1]) soit vrai alors par récurrence l'[x := 1] est satisfaisable donc l'est satisfaisable, 

ce qui correspond à la valeur vrai de DPLL(T). 
— Supposons que DPLL(T {x := 1]) soit faux, alors par récurrence l'{x := 1] est insatisfaisable. Donc Fest insatis- 
faisable, ce qui correspond à la valeur faux de DPLL(T). 


Théorème 2.3.10 L'’algorithme Algo_DPLL se termine. 


Preuve : Au pas O, la fonction Algo_DPLL consiste en un test, puis soit le renvoi de la valeur vrai soit l’appel de la 
fonction DPLL(T). Le pas 0 consiste en la suppression de clauses de l’ensemble de départ, cet ensemble étant fini, le pas 0 
termine. Donc, la fonction Algo_DPLL termine si la fonction DPLL(T”) termine. 

Considérons un appel de la fonction DPLL(T”). Le pas 1 est constitué d’un test et d’instructions élémentaires, donc 
il termine. Le pas 2 consiste à réduire Ï° qui est un ensemble fini. La réduction consistant à supprimer des clauses, elle 
termine. Le pas 3 consiste à supprimer des clauses, puis éventuellement retourner au pas 1. Le nombre de clauses étant 
fini, soit l'algorithme termine en 1, soit le pas 4 débute. De la même manière, le pas 4 consiste à supprimer des clauses 
et des variables, qui sont en nombres finis, puis éventuellement retourner au pas 1. Le nombre de clauses et de variables 
étant fini, soit l’algorithme termine en 1, soit le pas 5 débute. Le pas 5 consiste en un ou deux appels récursifs sur un 
ensemble de clauses où une variable a disparu (la valeur d’une variable est fixée). Ainsi, la récurrence en 5 se termine car 
à chaque appel récursif le nombre de variables diminue strictement. D'où, l’algorithme Algo_DPLL termine. 


Remarque 2.3.11 (Oubli de simplifications) L’algorithme Algo_DPLL a été donné avec les étapes de « simplification » : 
suppression des clauses valides (0), réduction (2), enlèvement des littéraux isolés (3) et réduction unitaire (4). L’algo- 
rithme reste correct si nous omettons ces étapes, ou si nous ne faisons qu'une partie des simplifications, ce qui est souvent 
le cas lorsque nous faisons une trace de l'exécution sans machine. Car sans machine il est fréquent d'oublier des simpli- 
Jications, ce qui ne nuit pas car l'algorithme reste correct. 


Remarque 2.3.12 (Choix de la variable) Un bon choix pour la variable x de l’étape (5), consiste à choisir la variable 
qui apparaît le plus souvent. Un meilleur choix consiste à choisir la variable qui va entraîner par la suite le plus de 
simplifications : il faut faire des compromis entre le temps passé à choisir la « bonne » variable et l’importance des 
simplifications induites par ce choix. Plusieurs heuristiques classiques de choix de variable sont présentées dans le para- 


graphe 


2.3.5 Solveurs SAT 


Le problème SAT est un problème de décision qui consiste à déterminer si une formule propositionnelle en forme 
normale conjonctive admet ou non un modèle. Ce problème est le problème NP-complet de référence [5]. Généralement, 
seule une version de ce problème, appelée 3-SAT, où toutes les clauses de la formule sont constituées d’exactement trois 
littéraux, est considérée, car des réductions linéaires existent pour passer de SAT à 3-SAT. Un exemple de réduction SAT 
vers 3-SAT est étudié dans l’exercicePT page 54] 

Des programmes performants sont dédiés à la résolution du problème SAT[] Ces programmes sont appelés des sol- 
veurs SAT et sont généralement classés en deux catégories : 


1. Dans ces programmes, le formalisme 3-SAT est généralement préféré au formalisme SAT, car son aspect régulier permet d’obtenir des solutions 
plus efficaces. 
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— Les solveurs SAT « complets » sont généralement des versions améliorées de l’algorithme DPLL. Parmi les solveurs 
SAT complets les plus utilisés à l’heure actuelle, nous pouvons citer par exemple zchaff, satz, march ou encore 
GRASP. 

— Les solveurs SAT « incomplets » sont des algorithmes de semi-décision qui finissent par trouver un modèle à la 
formule, s’il existe et qui ne terminent pas dans le cas contraire. Ces algorithmes sont fondés sur des marches 
aléatoires dans l’espace d’état. Dans cette catégorie, nous pouvons citer les algorithmes par exemple WalkSAT et 
GSAT. 

Nous décrivons maintenant, de manière non-exhaustive, les principales améliorations de l’algorithme DPLL utilisées dans 
les solveurs SAT complets. 


2.3.5.1 Heuristique de branchement 


Le choix de la prochaine variable à affecter a un impact important sur la taille de l’arbre de recherche développé 
par DPLL. Aïnsi, le choix de l’heuristique de branchement est déterminant dans les algorithmes fondés sur DPLL. Les 
heuristiques de branchement sont souvent basées sur des arguments syntaxiques tels que la taille des clauses, le nombre 
d’occurences, etc. Parmi les heuristiques les plus connues, nous pouvons citer : 


MOMS : L’heuristique MOMS (pour Maximum Occurences in Clauses of Minimum Size) consiste, comme son nom 
l’indique, à sélectionner la variable ayant le plus d’occurences dans les clauses les plus courtes. Les choix effectués 
par cette heuristique favorisent la propagation unitaire. 


JW : L’heuristique JW (pour Jeroslow-Wang) utilise également la longueur des clauses. En effet, un poids est affecté 
à chaque littéral en fonction de la taille des clauses où il apparaît. La possibilité qu’une variable soit sélectionnée 
par JW est inversement proportionnelle à la somme des tailles des clauses où elle apparaît. 


UP : Contrairement aux deux heuristiques précédentes, l’heuristique UP (pour Unit Propagation) n’est pas fondée 
sur des arguments syntaxiques. Cette heuristique essaie de sélectionner une variable en prévoyant à l’avance son 
effet sur la recherche. Elle consiste à calculer un poids pour chaque variable en fonction des simplifications qu’elle 
génère par propagation unitaire. 


2.3.5.2 Ajout de clauses 


L'idée est d’ajouter des clauses, en pré-traitement, à l’ensemble initial de clauses . Le nouvel ensemble de clauses reste 
équivalent à l’ensemble initial. Par exemple, nous pouvons citer la résolution restreinte qui consiste à ajouter des résolvants 
de taille bornée. Ce type de méthode permet de réduire la taille de l’arbre recherche en amenant aux contradictions plus 
tôt dans la recherche. 


2.3.5.3 Analyse des conflits et retour-arrière non chronologique 


Lorsque l’algorithme DPLL atteint une contradiction (un conflit), il revient (chronologiquement) au dernier branche- 
ment de variable effectué. Or, ce branchement n’est pas nécessairement l’une des décisions à l’origine de la contradiction. 
L'analyse des conflits remédie à ce problème en tenant compte des décisions à l’origine du conflit. Cette analyse permet 
ainsi d'effectuer un retour-arrière non-chronologique, c’est-à-dire un retour direct au niveau, plus haut dans l’arbre, qui 
est à l’origine du conflit sans tester les niveaux intermédiaires. 


2.3.5.4 Apprentissage 


L'apprentissage consiste à analyser et apprendre les raisons qui ont amené à une contradiction : lorsqu’une assignation 
partielle amène à une contraction, il est possible d’isoler un sous-ensemble d’assignations et un sous-ensemble de clauses, 
qui sont responsables du conflit. À partir de ces assignations, il est possible de construire (d’apprendre) une clause qui est 
impliquée par ces clauses. Cette nouvelle clause est ajoutée à l’ensemble de clauses du problème. Les assignations perti- 
nentes sont déterminées par un graphe de dépendance entre les clauses et les assignations, appelé graphe d’implication. 
Les clauses apprises permettent de ne pas refaire plusieurs fois les mêmes « erreurs » dans l’arbre de recherche. 


2.3.5.5 Redémarrage 


La plupart des solveurs SAT actuels utilisent une stratégie de redémarrage, qui consiste à redémarrer la recherche en 
prenant en compte de nouvelles clauses apprises durant la recherche précédente. La plupart des solveurs effectuent un 
redémarrage après qu’un seuil de clauses apprises soit atteint. Ainsi, à chaque redémarrage, le parcours de l’espace de 
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recherche change car l’ensemble de clauses est modifié. Il faut noter que la plupart des solveurs effacent régulièrement les 
clauses apprises. Ainsi, le mixage des redémarrages et des oublis peut dans certains cas mettre en cause la complétude des 
solveurs. Un paramétrage des redémarrages est donc nécessaire pour garder cette dernière propriété. Le solveur Chaff, par 
exemple, augmente à chaque redémarrage le seuil au-delà duquel une clause est oubliée. Aïnsi, de plus en plus de clauses 
sont gardées, ce qui assure la complétude. 


2.3.5.6 Structures de données paresseuses 


Dans les solveurs SAT modernes, 80% du temps de calcul est consommé par la propagation unitaire. Aïnsi, des 
structures de données dites « paresseuses » ont été introduites dans le but d’optimiser la propagation unitaire. 
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2.4 Exercices 


Exercice 31 (Résolvant) Par résolution, nous avons : 


Montrer que : b+b}£(a+b).(a+b). 


Exercice 32 (Résolvant) Nous rappelons que deux clauses sont égales si et seulement si elles ont les mêmes ensembles 
de littéraux. 
— Les clauses p+q+r+q+p+s+qg+rets+q+Tr+p sont-elles égales ? 
— Les clauses p+gqg+r+petq+r+q+r+q<+r sont-elles égales ? L'une est-elle incluse dans l’autre ? L'une 
est-elle la conséquence de l’autre ? Sont-elles équivalentes ? 
— Indiquer tous les résolvants des clauses a+ b+ceta+b+c. Ces résolvants sont-ils valides ? 


Exercice 33 (Preuve) Les ensembles de formules suivants sont insatisfaisables. 
— {a,a= b,b}. 
— {a+b,a+c,a+d,d+c,b+a}. 
— {a+b+c,a+b,b+c,c+a,a+b+c}. 

En donner une preuve par résolution. 


Exercice 34 (Formalisation et résolution.*) Remarquons que : « x à moins que y » se formalise en -(x & y). Dans 
une maison hantée, les esprits se manifestent sous deux formes différentes, un chant obscène er un rire sardonique, 
cependant nous pouvons influencer le comportement en jouant de l’orgue ou en brûlant de l’encens. Compte-tenu des 
données suivantes : 

(i) Le chant ne se fait pas entendre, à moins que nous jouions de l’orgue sans que le rire ne se fasse entendre. 

(ii) Si nous brûâlons de l’encens, le rire se fait entendre si et seulement si le chant se fait entendre. 

(iii) (En ce moment) Le chant se fait entendre et le rire est silencieux. 

Et de la conclusion : 

(iv) (En ce moment) Nous jouons de l’orgue et ne brûlons pas d’encens. 

Nous posons : 

— c: le chant se fait entendre. 

o : nous jouons de l’orgue. 
— r':le rire se fait entendre. 

e : nous brûlons de l’encens. 


1. Simplifier en produit de clauses -(x & y). 
2. Formaliser sous forme de produit de clauses les hypothèses et la négation de la conclusion. 


3. Prouver par résolution que le raisonnement est correct. 


Autrement dit transformer le produit des hypothèses et de la négation de la conclusion en un produit de clauses, et en 
déduire la clause vide. 


Exercice 35 (Preuve,*) Montrer, à l’aide d’une preuve par résolution, la correction du raisonnement suivant : 


r+q t,1.q r,gKt F. 


Exercice 36 (Formalisation et preuve,*) Montrer par résolution que le raisonnement suivant est contradictoire : 
— Il fait beau à moins qu'il neige. 
— Il pleut à moins qu'il neige. 
— 1l fait beau à moins qu’il pleuve. 
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Exercice 37 (C® Définir une clause) Une clause est la clause vide ou une disjonction (non vide) de littéraux. Donner une 
définition formelle de ce qu'est une clause et définir par récurrence la fonction s telle que s(C) est l’ensemble des littéraux 
de la clause C. 


Exercice 38 (C®Preuve) Prouver la propriété|2.1.14 page 40\sur la monotonie et composition. 
Exercice 39 (®Propriété de la résolution) Montrer la propriété 


Exercice 40 (C®La résolution n’ajoute aucun littéral,*) Soit L un ensemble de clauses. Un littéral de TV est un littéral 
d’une clause de Y'. Montrer que toute clause déduite de T'ne comporte que des littéraux de T. O 


Exercice 41 (Formalisation et résolution) Considérons les hypothèses suivantes : 
1. Si Pierre rate son tournoi alors Pierre sera déprimé. 
2. S'il fait beau alors Pierre ira à la piscine. 
3. Si Pierre ne va pas à la piscine il sera déprimé. 
4. À la piscine, Pierre ne s’entraîne pas. 
5. Pierre ratera son tournoi s’il ne s’entraîne pas. 


Nous souhaitons démontrer que des hypothèses précédentes, on peut déduire la conclusion suivante : 
— Pierre sera déprimé. 
Vous procéderez comme suit : 
— Formaliser les hypothèses et la négation de la conclusion. 
— Déduire de vos énoncés formels un ensemble de clauses équivalent. 
— Prouver qu'il est correct de déduire la conclusion à partir des hypothèses en démontrant avec une preuve par 
résolution que l’ensemble de clauses est contradictoire. 


Exercice 42 (Formalisation et résolution) 

Les Beatles étaient un groupe de rock qui s’est formé dans les années soixantes à Liverpool. Ce groupe était com- 
posé de quatres garçons : Ringo Starr. Paul MacCartney, John Lennon et Georges Harrison. À l’époque où s’est formé 
le groupe, il n’a pas été évident de décider qui allait jouer de quel instrument. Pour preuve, voici un extrait de leurs 
discussions : 


Paul dit : « Si Ringo ne joue pas de la guitare, alors je jouerai de la basse et John jouera de la guitare », 
Georges dit : « Je jouerai de la guitare si et seulement si John en joue », 
John dit : « Si Paul joue de la basse, alors Georges jouera de la guitare », 
Ringo dit : «Je jouerai de la batterie et donc pas de la guitare ». 
Après cette discussion, ils décidèrent que : 
— Ringo jouerait à la batterie, 
— Paul jouerait de la basse, et que 


— John et Georges joueraient tous les deux de la guitare. 
Nous allons maintenant montrer que cette conclusion a satisfait tous les membres du groupe. 


1. Formalisez les quatres hypothèses et la conclusion en utilisant les variables propositionnelles suivantes : 
— RB : « Ringo joue de la batterie », 
— RG : « Ringo joue de la guitare », 
— PB : « Paul joue de la basse », 
— JG : « John joue de la guitare », et 
— GG: « Georges joue de la guitare ». 


2. Transformez en clauses les hypothèses et la négation de la conclusion. 


3. Démontrez avec une preuve par résolution que la conclusion est conséquence des hypothèses. 


Exercice 43 (Réduction, X1603 Andrews) Soit l’ensemble de clauses : 


{p+qp+r+q+p,p+rq+p+g,q+r+p;r+q+p+rr+a}. 
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1. Réduire cet ensemble (la réduction est définie enf.T.4 page 72) 


2. Indiquer si l’ensemble réduit est ou non satisfaisable. 


Exercice 44 (DPLL) Considérons l’ensemble de clauses suivant : 
{a+b+f,a+b+f,e+a,a+b,a+c,d+a+d,a+b,a+c+d,d}. 


— Appliquer l'algorithme Algo_DPLL sur cet ensemble de clauses. 
— Conclure si cet ensemble est satisfaisable ou non. 
— Donner un modèle ou un contre-modèle obtenu à partir de la trace de l'algorithme. 
Dans l’arbre d'appel vous étiquetterez les étapes comme suit : 
— Suppression des clauses valides, en abrégé VAL. 
— Réduction, en abrégé RE. 
— Suppression des clauses ayant des littéraux isolés, en abrégé ELI. 
— Résolution unitaire, abrégé en RU. 
De plus, noter les affectations effectuées à chaque étape de l'algorithme afin de retrouver facilement le modèle construit. 


Exercice 45 (DPLL) Utiliser l'algorithme Algo_DPLL pour déterminer si les ensembles suivants de clauses sont satis- 
faisables ou insatisfaisables : 
{a+b+c+d+e+f,a+b,b+a,c+d,d+c,b+c,b+c,b+t,e,f}. 
{a+b+c+d+f,a+b,b+a,c+d,d+c}. 
{b+j+a,a+j+b,b+a+j,a+j,j+b,b+j,j+b,j+s,5+b}. 
{a+c+d,b+c+f,b+e+fc+e+f,e+f,c+d,a,e+f}. 
Donner une trace de l’algorithme. 


Exercice 46 (Stratégie complète) Soit L le produit suivant de clauses : 
(a+b+c).(b+c).(c+c).(b+c).(a+b+c).(a+b+c). 


Déterminer par la stratégie complète de résolution si TV est insatisfaisable ou possède un modèle. Donner la trace de 
l'algorithme. Indiquer la ou les preuves obtenues. SiT a un modèle indiquez-le. 


Exercice 47 (Stratégie complète) Soient l’ensemble de clauses suivant : 
PDAs EE ART ED REG REPTa RT ESS 


Appliquer l'algorithme de la stratégie complète sur cet ensemble de clauses et conclure si cet ensemble est satisfaisable 
ou non. 


Exercice 48 (Stratégie complète) Considérons la fonction f telle que f(x,y,z) = 0 si et seulement si le nombre d'ar- 
guments valant 1 est pair. Exprimer f comme un produit de clauses suivant la méthode décrite dans la sous-section[T.6] 


bpage 29]puis simplifier f en utilisant la stratégie complète. 


Exercice 49 (®Preuve) Prouver le lemme 
Exercice 50 (®Preuve) Prouver le lemme 


Exercice 51 (De SAT à 3-SAT,**#*) SAT est un problème de décision qui peut être énoncé comme suit : « étant donné un 
ensemble de clauses TV, existe-t-il une assignation qui soit modèle de T ? » 3-SAT est une restriction de ce problème où 
toutes les clauses de T ont exactement trois littéraux. 

SAT est un problème NP-complet (BY. Dans cet exercice, nous proposons d'étudier une réduction polynomiale de SAT 
vers 3-SAT, prouvant ainsi que 3-SAT est aussi NP-complet 

Une réduction polynomiale de SAT vers 3-SAT consiste à transformer en temps polynomial un ensemble de clauses T 
en un ensemble de clauses L' vérifiant les deux propriétés suivantes : 


2. Il faut noter qu’en général, un problème k-SAT n’est pas nécessairement NP-complet. Par exemple, 2-SAT a été prouvé polynomial. 
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(a) T' est uniquement constitué de clauses ayant trois littéraux distincts. 
(b) T a un modèle si et seulement si L’ a un modèle. 

Généralement, de telles réductions vérifient une propriété supplémentaire : 
(c) Tout modèle de T' est un modèle deT. 


Le but de cet exercice est de montrer que la transformation polynomiale présentée ci-dessous vérifie les trois propriétés 
énoncées ci-dessus. Noter que cette transformation introduit des variables supplémentaires. 


SoitT = {ci1,...,c»} un ensemble de clauses. La réduction consiste à remplacer toute clause c; = 71 +...+2x de T 
(ATTENTION : z1,...,zx sont des littéraux) par un ensemble de clauses C! construit en fonction de la valeur de k, comme 
suit : 

k=1: Ci = {2141 +92, 21 +1 +92, ai + y1 +y2, 1 + y1 +2} où y1 ef ya sont des variables supplémentaires. 

k=2: C! = {21 +22 + ÿ1, 1 +22 +1} où y1 est une variable supplémentaire. 

k=3: Ci=f{c}. 

kR>3: C={z1+22+y1, Jr +23 +ÿ2, Y2 +24 +y3, V3 +25 +94, Yes +1 +} Où ÿ1,..…., 3 sont des variables 


supplémentaires. 
: ; m [À 
Ainsi, = (JC. 


Par construction, la réduction proposée vérifie la propriété (a). Les réponses aux questions suivantes permettent de 
prouver les propriétés (b) et (c) : 


1. Montrer (sans table de vérité) que toute assignation donne la même valeur à c; et C' lorsque c; est constituée d’un 
seul littéral. 


2. Montrer (sans table de vérité) que toute assignation donne la même valeur à c; et C' lorsque c; est constituée de 
deux littéraux. 


3. Soit c; une clause de plus de 3 littéraux. Montrer que si c; a un modèle, alors C! a aussi un modèle. 
4. Soit c; une clause de plus de 3 littéraux. Montrer que tout modèle de C! est modèle de ci. 


5. La réduction proposée maintient uniquement la satisfaisabilité. Montrer qu'elle ne maintient pas le sens. 
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Chapitre 3 


Déduction Naturelle 
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U NE preuve dans les cours de Mathématiques est une décomposition du raisonnement en pas élémentaires évidents, 
nous pratiquons alors sans le savoir la déduction naturelle. Dans ce chapitre, nous présentons un système formel qui 
est une modélisation particulière de la déduction naturelle. La déduction naturelle et le calcul de séquent furent introduits 
en 1934 par Gerhard Gentzen (1909-1945) [TA[T3]. Les preuves dans notre système ne sont pas des arbres comme dans 
le système original de Gehard Gentzen mais ressemblent plus aux preuves des mathématiciens. Nous expliquons aussi 
comment faire le lien entre ces deux formalismes en construisant des arbres proches de ceux introduits originellement. 
Nous choisissons de ne parler que de la logique classique, par opposition à la logique intuitionniste qui est obtenue en 


omettant la règle de réduction à l’absurde (la dernière règle de la table[3.T page 59}. 


Remarque préliminaire : Pour simplifier l’étude de la déduction naturelle, nous considérons que le vrai, la négation et 
l’équivalence sont des abréviations ainsi définies : 

— T abrège L = IL. 

— —À abrège À = 1. 

— À & B abrège (A = B)A(B—= À). 
Deux formules seront considérées comme égales, si les formules obtenues en éliminant les abréviations sont identiques. 
Par exemple, les formules a, -a = L et (a = L)— L sont égales. Il est clair que deux formules égales, au sens ci- 
dessus, sont équivalentes (voir exercice[53 page 67) et nous utilisons implicitement cette propriété quand nous remplaçons 
une formule par une autre formule égale aux abréviations près. 


Plan : Nous décrivons tout d’abord notre système de règles de déduction naturelle et introduisons la notion de preuve 
dans ce contexte. Ensuite, nous présentons des tactiques pour aider le lecteur à la rédaction de preuve. Nous montrons 
la cohérence et la complétude de notre système. Enfin nous présentons un outil permettant à partir d’une formule de 
construire automatiquement une preuve ou bien d’exhiber un contre-exemple. 
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3.1 Système formel de la déduction naturelle 


Nous présentons d’abord les règles du système de la déduction naturelle. Elles constituent les raisonnements élémen- 
taires autorisés. Ensuite nous exposons la notion de preuve qui se construit par applications successives de ces règles. 


Définition 3.1.1 (Règle) Une règle est constituée de formules dites hypothèses H1,...,H, et d’une conclusion. Les hypo- 
thèses sont écrites au-dessus d’un trait et l’unique formule en dessous de ce trait est la conclusion de la règle. Le nom 
d’une règle est écrit au même niveau que le trait séparant hypothèses et conclusion. 


H1...Hh 


La déduction naturelle que nous présentons comporte une dizaine de règles de déduction qui sont regroupées dans la 
table[3.T page suivante] La règle fondamentale est la suivante : si nous pouvons déduire une formule B d’une hypothèse À, 
alors nous pouvons déduire À — B en nous passant de cette hypothèse. Nous décrivons chacune des dix règles du système 
de déduction que nous considérons. L'application de ces règles et seulement de ces règles va nous permettre de prouver la 
correction des raisonnements. Il est donc important de bien comprendre le fonctionnement de chacune d’entre elles. Nous 
avons deux familles de règles pour chaque connecteur : les règles d’introduction et les règles d’élimination. L’intuition du 
rôle des règles d’introduction est de générer un symbole de la logique afin de bâtir progressivement la formule à prouver. 
Les règles d'élimination servent à simplifier un raisonnement ou à obtenir une nouvelle formule grâce aux raisonnements 
déjà réalisés et ainsi faire disparaître un connecteur logique. En plus nous avons deux règles spéciales, que nous décrirons 
en dernier, une pour éliminer deux occurrences successives de la négation et une autre pour déduire d’importe quoi à partir 
du faux. 


3.1.1 Règles de conjonction 


La règle d’introduction de la conjonction, notée AI, signifie simplement que si nous avons une preuve de À et une 
preuve de B, alors nous pouvons déduire une preuve de la proposition À A B. Nous pouvons aussi dire que la preuve de la 
proposition À A B peut se décomposer en une preuve de À et une preuve de B. 


A _B 
AAB M 

Les règles d’élimination de la conjonction, notées AE 1 et AE2, permettent de déduire à partir de la conjonction de 
deux formules À A B soit la formule À soit la formule B. Ainsi nous avons éliminé le connecteur de la conjonction. 


AAB AAB 


À B AE2 


3.1.2 Règles de disjonction 


Les règles d’introduction de la disjonction sont les duales des règles de l’élimination de la conjonction. Les deux règles 
d'introduction, notées VI1 et VI2, permettent de créer une disjonction de deux formules à partir d’une des deux formules. 
Ces règles signifient simplement que si À est vraie alors À VB et B VA sont aussi vraies quelle que soit la proposition B. 


A A 
AVB VII BVA VI2 


La règle d'élimination de la disjonction, notée VE, est plus complexe. Afin de déduire la formule C à partir de la 
disjonction À V B il faut aussi prouver les prémisses suivantes : À implique C et B implique C. Cette règle formalise 
la notion de preuve par cas utilisée en mathématiques : supposons que dans un environnement donné, nous souhaitons 
prouver C alors que deux cas, À ou B, sont possibles ; nous nous plaçons alors dans le cas où À est vérifiée et nous prouvons 
C, puis nous nous plaçons dans le cas où B est vérifiée et nous prouvons C. 


AVB 42C B=cC VE 
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3.1.3 Règles de l’implication 


La règle de l’élimination de l’implication — E dit que si nous sommes capables d’obtenir une preuve de À et une 
preuve de À — B alors nous avons une preuve de B. Cette règle correspond au modus ponens. 


A A=B 


B = E 


La règle fondamentale de notre système est la règle d’introduction de l'implication = I : si nous pouvons déduire 
une formule B d’une hypothèse À, alors nous pouvons déduire À = B en nous passant de cette hypothèse. Cette règle est 
résumée par le schéma ci-dessous, où la notation [A] indique que si À est une hypothèse de la preuve de B, cette hypothèse 
est enlevée de la preuve de À = B, autrement dit ne sert plus pour prouver À = B. 


AA 
_B_ ; 


3.1.4 Deux règles spéciales 


Enfin nous avons deux règles spéciales : 
— La première permet de déduire n’importe quoi à partir du faux : il s’agit de la « règle du faux », notée E fq, pour 
la formule latine « ex falso, quodlibet », indiquant que du faux, on peut déduire ce qu’on veut. 


4 
4 Efa 


— La seconde est la règle de réduction à l’absurde, notée RAA pour « reductio ad absurdum ». Elle élimine deux 
occurrences successives de la négation. 


A 


Nous regroupons l’ensemble des règles de la déduction naturelle dans la table[3.1] 


Introduction Élimination 
Règle du faux 
Règle de réduction à l’absurde 


TABLE 3.1 - Ensemble de règles de déduction naturelle. 
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3.15 Preuves en déduction naturelle 


Intuitivement une preuve est l’application successive de règles de la déduction naturelle. Dans le système originel 
introduit par Gerhard Gentzen, une preuve est représentée par un arbre de formules (certaines formules pouvant être 
marquées comme enlevées). Nous avons choisi de représenter une preuve par une succession d’étapes de raisonnement 
basées sur les règles de la déduction naturelle, ceci afin d’être plus proche des preuves faites en mathématiques. Dans 
le chapitre précédent, une preuve par résolution était constituée d’une liste de clauses. En déduction naturelle, au cours 
d’une preuve, nous pouvons ajouter des hypothèses et les enlever, ce qui rend plus complexe la définition de ce qu’est 
une preuve. Nous introduisons donc plusieurs notions intermédiaires afin de définir clairement la notion de preuve en 
déduction naturelle. Tout d’abord nous introduisons les composants d’une preuve, c’est-à-dire, les « lignes d’une preuve », 
puis la notion de brouillon de preuve, ensuite les contextes de ces lignes de preuve afin de définir une preuve en déduction 
naturelle. 


3.1.5.1 Brouillon de preuve 


Une preuve est constituée d’une succession de lignes qui sont soit une formule soit une formule précédée par le mot 
clef « Supposons » ou « Donc ». 


Définition 3.1.2 (Ligne de preuve) Une ligne de preuve est de l’une des trois formes suivantes : 
— Supposons formule, 
— formule, 
— Donc formule. 


Un brouillon de preuve est une preuve en construction, intuitivement elle a au moins autant de Supposons que de 
Donc. 


Définition 3.1.3 (Brouillon de preuve) Un brouillon de preuve est une suite de lignes telle que, dans tout préfixe de la 
suite, le nombre de lignes commençant par le mot Supposons est au moins égal à celui des lignes commençant par le 
mot Donc. 


Exemple 3.1.4 Dans l'exemple ci-dessous, la suite des lignes de 1 à 3 est un brouillon de preuve. Par contre la suite des 
lignes de 1 à 5, n’est pas un brouillon de preuve car dans la suite des lignes 1 à 4, le nombre de lignes commençant par 
le mot Donc dépasse celui des lignes commençant par le mot Supposons. 


numéro | ligne 

1 Supposons a 
2 aVb 

> Donca—=aVb 
4 Donc —a 

5 Supposons b 


3.1.5.2 Contexte des lignes d’un brouillon de preuve 


Afin de pouvoir appliquer la règle d’introduction de l’implication nous avons besoin de connaître à chaque étape d’une 
preuve les formules qui sont des hypothèses utilisables. Pour ce faire, nous associons à chaque ligne d’un brouillon de 
preuve un contexte, qui est la suite des hypothèses introduites par les lignes Supposons et non enlevées par les lignes 
Donc. Puisque dans tout préfixe d’un brouillon de preuve, le nombre de lignes commençant par le mot Supposons est au 
moins égal à celui des lignes commençant par le mot Donc, le contexte de la ligne précédant une ligne Donc n’est pas 
vide et par suite le contexte de chaque ligne d’un brouillon de preuve est bien défini. Dans la suite, nous représentons les 
contextes de chaque ligne en remplaçant chaque hypothèse du contexte par le numéro de la ligne où cette hypothèse est 
introduite. 


Définition 3.1.5 (Contexte) Nous numérotons les lignes d’un brouillon de preuve de 1 à n. Pour i de 1 à n, la liste de 
formules T'; est le contexte de la ligne i. La liste To est vide et les listes de formules T'; sont ainsi définies : 

— Si la ligne i est « Supposons À », alors L';=T; 1,i. 

— Si la ligne i est « À » alors I; =T; 

— Si la ligne i est « Donc À » alors T'; est obtenue en enlevant la dernière formule de T';_; 
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La liste T'; est le contexte de la ligne i. 


Nous présentons nos preuves sous forme de tableaux, ce qui nous permet de numéroter les lignes d’une preuve, les 
contextes utilisables, et les règles utilisées pour générer une nouvelle ligne. 


Exemple 3.1.6 Nous illustrons ici la gestion des contextes sur un brouillon de preuve simple. 


contexte | numéro | ligne règle 

1 1 Supposons a 

1,2 2 Supposons b 

1,2 3 ab N 1,2 
1 4 Donch=aAb | —=12,3 
1,5 5 Supposons e 


3.1.5.3 Preuves 


Nous précisons la notion de conclusion et de formule utilisable afin de définir et manipuler des preuves en déduction 
naturelle. 


Définition 3.1.7 (Conclusion, formule utilisable) Nous définissons la notion de conclusion et de formule utilisable : 
— La formule figurant sur une ligne d’un brouillon de preuve est la conclusion de la ligne. 
— La conclusion d’une ligne est utilisable fant que son contexte (c’est-à-dire les hypothèses qui ont permis de la 
déduire) est présent. 


Autrement dit la conclusion de la ligne i est utilisable sur la ligne i et sur toutes les lignes suivantes dont le contexte a 
pour préfixe le contexte de la ligne :. 


Exemple 3.1.8 Dans l'exemple ci-dessous, la conclusion de la ligne 2 est utilisable sur la ligne 2, et pas au delà, car à 
la ligne 3, l'hypothèse qui a permis de la déduire est enlevée. 


contexte | numéro | ligne règle 
1 1 Supposons a 
1 2 aVb VII 1 
3 Donca—=aVb = I 1,2 
4 4 Supposons € 
4 5 cVa VI 4 
6 Doncc=cVa = 14,5 
7 (a=aVb)A(c=cVa) | A 3,6 


Nous donnons la définition de preuve dans un environnement. Un environnement est un ensemble de formules suppo- 
sées « vraies ». Intuitivement, réaliser une preuve dans un environnement consiste à pouvoir utiliser sans les prouver les 
formules de l’environnement. 


Définition 3.1.9 (Preuve) Soit TL un ensemble de formules, une preuve dans l’environnement L est un brouillon de preuve 
ayant les propriétés suivantes : 


1. Pour toute ligne « Donc À », la formule A est égale à B = C, où B est la dernière formule du contexte de la ligne 
précédente et où C est une formule utilisable sur la ligne précédente ou égale à un élément de l’environnement T. 


2. Pour toute ligne « A », la formule À est la conclusion d’une règle (autre que la règle d'introduction de l’implica- 
tion) dont les prémisses sont utilisables sur la ligne précédente ou sont éléments de l’environnement T.. 


La ligne « Donc À » est une application de la règle d'introduction de l’implication. En effet, C est déduite de T° ou 
d’hypothèses qui figurent dans la ligne précédente. La liste des hypothèses de la ligne précédente se terminant par B, nous 
pouvons en déduire B = C, en nous passant de l’hypothèse B. 


Définition 3.1.10 (Preuve d’une formule) Une preuve de la formule A dans l’environnement TV est soit la preuve vide 
lorsque À est élément de Y,, soit une preuve dont la dernière ligne est de conclusion A et de contexte vide. 
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Nous notons l'+ À le fait qu’il y a une preuve de À dans l’environnement let l'H P : A le fait que P est une preuve de 
À dans l’environnement I. Lorsque l’environnement est vide, nous l’omettons, autrement dit nous abrégeons ÜH À en A. 


Lorsque nous demandons une preuve d’une formule sans indiquer d’environnement, nous supposons que l’environnement 
est vide. 


Exemple 3.1.11 Prouvons (a = b) = (-b = -a). 


contexte | numéro | preuve règle 


HINIOQ|UIR ID Ie 


La preuve elle-même est ce qui figure dans la colonne preuve. Nous y avons ajouté la numérotation des lignes de 
preuves, les justifications qui indiquent les règles utilisées et les contextes de chaque ligne de la preuve. 
Nous présentons la même preuve sous forme d’arbre, ce qui correspond à l’approche originelle de Gerhard Gentzen. 


Nous remarquons que pour lever une hypothèse il est d'usage de barrer cette hypothèse. 


Exemple 3.1.12 Nous donnons la preuve de —A VB dans l’environnement À = B. Nous suggérons de numéroter par i, üi, 
iii, etc. les formules de l’environnement pour distinguer ces numéros et les numéros des lignes de la preuve. 


environnement 


référence formule 
i AB 
contexte | numéro | preuve règle 


© Co NN À LR & D 


Ru 
© 
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Nous présentons aussi la preuve précédente sous forme d'arbre. 


Comme il a été rappelé dans les remarques préliminaires, nous considérons comme égales deux formules qui sont iden- 
tiques quand nous éliminons leurs abréviations. Aïnsi dans l’exemple précédent, nous avons identifié À = L et —A ainsi 


que (-AVB)—= Let -(-AVB). 


3.2 


Tactiques de preuve 


Nous donnons des conseils pour construire des preuves. Ces conseils sont la base du logiciel présenté dans le para- 
graphef3.3 page 66] Pour prouver la formule À dans un environnement T', nous appliquons dans l'ordre les règles suivantes, 
où l’ordre a été choisi de façon à reculer le plus possible l’usage de la règle RAA : 


1: 
2. 
3: 


Si À € F, alors la preuve obtenue est vide. 
Si À est la conséquence d’une règle dont les premisses sont dans F, alors la preuve obtenue est « À ». 


Si l comporte une contradiction, c’est-à-dire une formule B et une formule —B, alors la preuve obtenue est « 1, 
A ». 


. SiA = BAC, alors : 


— prouver B : Soit P la preuve obtenue pour B, 

— prouver C : Soit Q la preuve obtenue pour C. 

La preuve obtenue pour À est « P, Q, À ». 

Les preuves peuvent échouer (si l’on demande de prouver une formule improuvable dans l’environnement donné) : 
Si la preuve de B ou C échoue, il en est de même de la preuve de À. Pour simplifier la suite, nous ne signalons plus 
les cas d’échecs, sauf s’ils doivent être suivis d’une autre preuve. 


. SiA = B = C, alors prouver C sous l’hypothèse B (qui est ajoutée à l’environnement). Soit P, la preuve obtenue 


pour C, la preuve obtenue pour À est « Supposons B, P, Donc À ». 


. SiA = BVC, alors prouver B : Si P est la preuve obtenue pour B, alors « P, A » est la preuve obtenue pour À. Si la 


preuve de B échoue, alors prouver C : Si P est la preuve obtenue pour C, alors « P, A » est la preuve obtenue pour 
A. Si la preuve de C échoue, essayer les règles suivantes. 


. Si BAC est dans l’environnement, alors prouver À à partir des formules B, C, qui remplacent B AC dans l’en- 


vironnement et soit P le résultat de cette preuve. Alors « B, C, P » est une preuve de À dans l’environnement 
initial. 


. SiBVC est dans l’environnement, alors : 


— prouver À dans l’environnement où B remplace B VC : Soit P la preuve obtenue, 
— prouver À dans l’environnement où C remplace B VC : Soit Q la preuve obtenue. 
La preuve de À est alors « Supposons B, P, Donc B = À, Supposons C, Q, Donc C = AÀ,A ». 


. Si -(B VC) est dans l’environnement, alors nous déduisons —B par la preuve P4 et -C par la preuve P5 (preuves 


demandées à l’exercice59 page 68}. Soit P la preuve de À dans l’environnement où —B, -C remplacent la formule 
—(B VC). La preuve de À est « P4, P5, P ». 
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10. SiA = BVC, alors prouver C sous l'hypothèse -B : soit P la preuve obtenue. « Supposons -B,P, Donc -B=C>» 
est une preuve de la formule -B — C qui est équivalente à À. Pour obtenir la preuve de A, il suffit d’ajouter la 
preuve P1, demandé à l’exercicel59 page 68| de À dans l’environnement -B = C. La preuve obtenue de À est donc 
« Supposons —B, P, Donc -B—=C, PI». 


11. Si (BAC) est dans l’environnement, alors nous en déduisons —B V -C par la preuve P3 demandée à l’exercice[59] 
page 68[puis nous raisonnons par cas comme ci-dessous : 
— prouver À dans l’environnement où -B remplace -(B AC) : Soit P la preuve obtenue, 
— prouver À dans l’environnement où —C remplace -(B AC) : Soit Q la preuve obtenue. 
La preuve de À est « P3, Supposons —B, P, Donc -B = À, Supposons -C, Q, Donc -C = À, A». 


12. Si -(B = C) est dans l’environnement, alors nous déduisons B par la preuve P6, -C par la preuve P7 (preuves 
demandées à l’exercice[S9 page 68). Soit P la preuve de À dans l’environnement où B, —C remplacent la formule 
—(B = C). La preuve de À est « P6, PT, P». 


13. Si B = C est dans l’environnement et si C Æ L, autrement dit si B = C n’est pas égale à —B, alors, nous déduisons 
—B VC dans l’environnement B = C par la preuve P2 demandée à l’exercice[S9 page 68[puis nous raisonnons par 
Cas : 
— prouver À dans l’environnement où -B remplace B = C : Soit P la preuve obtenue, 
— prouver À dans l’environnement où C remplace B = C : Soit Q la preuve obtenue. 
La preuve de À est « P2, Supposons -B, P, Donc -B = À, Supposons C, Q, Donc C = AÀ,A ». 


Exemple 3.2.1 Nous appliquons ces tactiques à la preuve de la loi de Peirce[]: ((p = q) = p) = p. Cette formule n’est 
pas prouvable en logique intuitionniste, qui est, ainsi qu'il est dit au début du chapitre, la logique classique privée de la 
règle de réduction à l'absurde. Nous pouvons montrer, qu'en logique intuitionniste, cette formule est équivalente à la loi 
du tiers-exclu. 

Vu la forme de la formule, nous devons appliquer la tactiqueF] La preuve de la formule de Peirce est donc de la forme 
suivante : 


Preuve Q : 
Supposons (pq) p 


Q\ preuve de p dans l’environnement (p = q) = p 
Donc ((pæg)>p)=p 


La preuve Q1 utilise nécessairement la tactique 13. Donc cette preuve s'écrit : Dans l’environnement B = C où B = p = 
g, C=p. 


Preuve Qi : 


Q11 = P2 où P2 est la preuve de —B VC dans l’environnement B = C, voir exercicel59 page 68] 


Supposons —B 


Q12 preuve de À = p dans l’environnement -B 
Donc —B = A 
Supposons C 


Q13 preuve de À = p dans l’environnement C 
Donc C = À 
A 


Q:3 est la preuve vide, car À =C = p. 
Q12 est la preuve de À = p dans l’environnement -(p = q). Cette preuve est la preuve P6 demandée à l'exercice F9 
page O8| où B = p et C = q. En recollant les morceaux O1, Qr1, Q12, Q13, nous obtenons la preuve Q, que nous ne 
recopions pas ici, car elle peut être obtenue automatiquement par le logiciel développé par Michel Levy, disponible à 
l'adresse suivante :\http://teachinglogic.univ-grenoble-alpes.fr/DN 

Nous montrons ci-dessous comme retrouver la preuve Q12 sans utiliser les tactiques. La seule règle, ne conduisant 


pas à une impasse, est la réduction à l'absurde. Donc cette preuve est de la forme : 


1. Charles Sanders Peirce était un logicien et philosophe américain (1839 - 1914). 
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Preuve Q12 de p dans l’environnement -(p = q) 
Supposons -p 


Qi preuve de L dans l’environnement -(p = q), -p 


Donc —-p 
P 


Pour obtenir une contradiction, donc une preuve de 1, il faut déduire p = q. Donc la preuve Qi est : 


Supposons p 


Donc p = q 


3.3 Cohérence de la déduction naturelle 


La preuve de cohérence de la déduction naturelle consiste à montrer que chaque preuve construite à partir d’un 
ensemble de formules I” donne une formule qui est déductible de T°. 


Théorème 3.3.1 (Cohérence de la déduction) Si une formule À est déduite d’un environnement de formules T (T + A), 
alors À est une conséquence de T (TH A). 


Preuve : Soit Fun ensemble de formules. Soit P une preuve de À dans cet environnement. Soient C; la conclusion et H; le 
contexte de la M ligne de la preuve P. Nous posons Ho — 0, la liste vide. Si la preuve P est vide, nous posons Co — A. 
Notons par I’, H; l’ensemble des formules de l’ensemble let de la liste H;. Nous montrons par induction que pour tout k 
nous avons [, 44 EH Cx, ce qui implique que pour la dernière ligne n de cette preuve, comme par définition A, est la liste 
vide et C, = À, nous obtenons T' = A. 


Cas de base : Supposons que À est déduite de I” par la preuve vide. Alors À est élément de I”, donc [° A. Puisque 
Ho = 0, nous pouvons conclure : T°, Ho EH À, donc T°, Ho E Co. 


Induction : Supposons que pour toute ligne i < k de la preuve nous avons F, H; = Ci. Montrons que l, Hy E C4. 
Supposons que la ligne k est : 


1. « Supposons C4 ». La formule C4 est la dernière formule de H}, donc 1”, H} = C4. 


2. «Donc C4 ». La formule C4 est égale à la formule B = D, et B est la dernière formule de H4_1. Nous distinguons 
deux cas, soit D est élément de l’, soit D est utilisable sur la ligne précédente. 


(a) Dans le premier cas, puisque D est égale à une formule de I”, D est conséquence de I” donc de F, A4. 
Puisque B — D est conséquence de D, il en résulte que l”, 44 = Cx 


(b) Dans le deuxième cas, D est utilisable sur la ligne précédente. Donc il existe i < k tel que D = C; et H; 
est préfixe de H}-_1. Par hypothèse de récurrence, T', H; = D. Puisque H; est préfixe de H}_1, nous avons 
V, H4_1 E D. Puisque B est la dernière formule de H4_;, nous avons H}_;1 = H;, B et donc l', 4H, B=D, 
ce qui implique T, 44 = B = D. Enfin puisque C4 est égale à B — D et que deux formules égales sont 
équivalentes, nous avons L, Hz = C4. 


3. «C4». Cette formule est la conclusion d’une règle de la table[3.T page 59] appliquée à ses prémisses utilisables 
à la ligne précédente ou aux éléments de I”. Considérons le seul cas de la règle AJ, les autres cas étant analogues. 
La formule C4 est égale à (D AE) et les prémisses de la règle sont D et E. Puisque D et E sont éléments de 
ou utilisables à la ligne précédente, comme dans le cas précédent, en utilisant l'hypothèse de récurrence, nous 
avons : [, H;_1 Det, H4_1 HE. Puisque la ligne k ne change pas les hypothèses, nous avons H}_1 = H4, 
donc I’, H = DetT, H4 HE. Puisque C4 est égale à (D AE), nous avons : D, E = Cy. Par suite L, Hy = C4. 
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3.4 Complétude de la déduction naturelle 


Nous prouvons la complétude des règles uniquement pour les formules avec les symboles logiques L, À, V, =. La 
complétude pour les formules obtenues en ajoutant les symboles logiques T, - et résulte immédiatement du fait que 
ces symboles peuvent être considérés comme des abréviations. 

Vu l'absence de négation, nous définissons un littéral comme étant une variable ou une implication entre une variable 
et L. Soit x une variable, x et x = L (qui peut être abrégé en —x) sont des littéraux complémentaires. Dans la suite nous 
distinguons une liste de formules let s(T°) l’ensemble des formules de la liste. Pour simplifier les notations, nous utilisons 
la virgule pour ajouter un élément en début ou en fin de liste ainsi que pour concaténer deux listes, que ces listes soit des 
listes de formules ou des preuves. 


Théorème 3.4.1 Soient L'un ensemble fini de formules et À une formule, siT À A alors HA. 


Remarque 3.4.2 Nous admettons ce thèorème dans ce polycopié. On peut en donner une preuve constructive, c’est-à- 
dire qu’elle donne un ensemble complet de tactiques pour construire des preuves d’une formule dans un environnement. 
Cependant ces tactiques peuvent donner des preuves longues. En particulier si nous devons prouver une formule (B VC), 
il vaut mieux en général suivre les tactiques données au paragraphe [.7 page 63] c’est-à-dire essayer de prouver B, puis 
essayer de prouver C et seulement en cas d’échec, utiliser la tactique donnée dans la preuve de complétude, qui « réduit » 
cette preuve à une preuve de C en ajoutant l'hypothèse —B. 


3.5 Outils 


Nous indiquons deux logiciels pour se familiariser avec la déduction naturelle. Le premier construit automatiquement 
des preuves comme nous les avons présentées, le deuxième illustre sur quelques exemples de manière interactive comment 
dessiner des preuves sous forme d’arbres. 


3.5.1 Logiciel de construction automatique de preuves 
Pour produire automatiquement des preuves, nous recommandons d’utiliser le logiciel : 
http://teachinglogic.univ-qrenoble-alpes.fr/DN 


Ce logiciel permet grâce à une syntaxe intuitive de saisir une formule et de générer automatiquement : 
— si la formule est (syntaxiquement) incorrecte, un message d’erreur (en rouge) est produit au dessus de la formule 
— si la formule est prouvable, sa preuve (sans annotation) est générée par le logiciel. 
— si la formule est correcte mais n’est pas prouvable, un contre-modèle est proposé au dessus de la formule. 
Si la formule est prouvable, il est aussi possible d’obtenir une version de la preuve annotée. 


3.5.2 Dessiner des arbres de preuves 


Ceux qui affectionnent les preuves sous forme d’arbres peuvent utiliser le logiciel suivant développé Laurent Théry : 


http://www-sop.inria.fr/marelle/Laurent.Thery/peanoware/Nd.html 


ou sa version Android : 


Ce logiciel se présente comme un jeu, il propose des formules à prouver et permet d’appliquer les règles de la déduction 
naturelle, de manière interactive, pour en construire les arbres de preuve. Quand vous réussissez à construire la preuve 
d’une formule, vous voyez la photo de Dag Prawitz, un des principaux logiciens qui a étudié les propriétés de la déduction 
naturelle. 
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3.6 Exercices 


Exercice 52 (Brouillon de preuve) La suite de lignes suivante n’est pas un brouillon de preuve. Indiquer le numéro i de 
la première ligne telle que les lignes 1 à i— 1 soient un brouillon de preuve et que les lignes 1 à i ne soient pas un brouillon 
de preuve. Préciser le contexte des lignes 1 à i— 1. 


contexte | numéro | preuve 


Supposons a 


Supposons b 


C 
Donc d 
Supposons € 


f 


Donc g 


ON IR ID) 


Ru 
© 
C7 
O 
| 
Q 

. 


Ru 
Ru 
Ü 
O 
=) 
a 
Es 


Ru 
D 
— 


Exercice 53 (Preuves de formules avec les règles spéciales) Donner une preuve pour les formules suivantes : 
1 a = --a, 
2. —-a—= a, 
3. a —-a, 
4. aV -a. 


Exercice 54 (Preuves simples de formules) Donner une preuve pour les formules suivantes : 
1. a = c dans l’environnement a = b, b= c. 
2. (a b)A(b=c) = (ac). 


3. (a=b)=((b=c)= (a c)). 


Exercice 55 (® Abréviations) Soient À une formule et dpl(A) la formule obtenue en remplaçant dans À, le vrai, les 
négations et les équivalences (en forme abréviées) par leur définition. dpl(A) est la formule obtenue en « dépliant » À, 
d’où le nom dpl choisi pour cette fonction de dépliage. 

— Définir par récurrence la fonction dpl. 

— Montrer que les formules À et dpl(A) sont équivalentes. 

— En déduire que deux formules, égales aux abréviations près, sont équivalentes. 


Exercice 56 (Preuves de formules) Donner une preuve pour les formules suivantes : 
1. a=(b= a). 

a\b= a. 

a (a = b). 

(a+ (= c))= (ab) = (a = c)). 

a\b= bA\a. 

aVb= bVa. 

(a= (b= c)) = (aAb= c). 

(aAb=c)=(a=(b= c)). 


% NN S M 8 © D 
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9. (a b)A(c= d)= (aAc—= bA\d). 


Exercice 57 (À propos de l’implication) Donner une preuve pour les formules suivantes : 


1. (#*) a = b dans l’environnement -a V b. 


2. (-b 


a) = (a = b). 


Exercice 58 (Algèbre de Boole) Donner une preuve pour les formules suivantes : 
—(a \-a). 
aVa— a. 


1. 


N D U & & D 


a\a— 4. 
aA(bVc)=añbVañc. 
añbVaAc=aA(bVc). 


. aVbAc= (aVb)A(aVc). 
. (aVb)A(aVc)=aVbAc. 


Exercice 59 (®Preuves de formules avec environnement) Donner une preuve des formules suivantes : 


1. 


N S HR © D 


PI: 
P2 : 
P3 : 
P4 : 
P5': 
P6 : 
P7: 


BVC dans l’environnement -B = C. 
—BVC dans l’environnement B = C. 
BV -C dans l’environnement -(B AC). 
—B dans l’environnement -(B VC). 

—C dans le même environnement -(B VC). 
B dans l’environnement -(B = C). 


—C dans le même environnement -(B = C). 


Exercice 60 (Preuves de formules) Donner une preuve en déduction naturelle des formules suivantes : 
(aVb) = (-aA-b). 
(-a Ab) = -(aVb). 


= 


. (#) (-aV-b) = -(a Ab). 

. (##) (aVb) A (-aVb) = b. 

. (F##) (a Ab) = (a V -b). 

. (##*) (aVb)A(-bVc) = aVec. 


Exercice 61 (Partiel 2011) Prouver les formules suivantes en utilisant la déduction naturelle sous forme de tableau : 
pA=(-pAg)= -q. 

2. ((pVqg)V(pVr))A-p= avr. 

3. (*)=pV=-(pAg)= -qV =p. 


1: 


Exercice 62 (Partiel 2013) Donner une preuve des formules suivantes en utilisant la déduction naturelle sous forme de 


tableau 


1 (pVg)=(CpA-g)=r. 
2. ((p=q)A(g=r))A-r = -p. 
3. (pq) = ((pAg)V-p). 
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Exercice 63 (Quelques questions posées en examen) 
1. Démontrer la formule suivante par déduction naturelle : (pVq)A(p=r)= avr 


2. Soient les hypothèses : 
— (H1) : Si Pierre est grand, alors Jean n’est pas le fils de Pierre 
— (H2) : Si Pierre n’est pas grand, alors Jean est le fils de Pierre 
— (H3) : Si Jean est le fils de Pierre alors Marie est la soeur de Jean 
Formaliser et démontrer qu’on peut en déduire la conclusion (C) : « Marie est la soeur de Jean ou Pierre est grand 
ou les deux à la fois » par déduction naturelle. 
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( | E célèbre syllogisme[]]ne peut pas se formaliser en logique propositionnelle : 


Tous les hommes sont mortels ; 
or Socrate est un homme ; 
donc Socrate est mortel. 


Pour formaliser un tel raisonnement nous avons besoin d’enrichir la logique propositionnelle avec de nouveaux 
connecteurs appelés quantificateurs, cette logique étendue s’appelle logique du premier ordre. Elle permet de parler de 
structures comportant un seul domaine non vide (contrairement à la logique propositionelle, ce domaine peut avoir plus 
de deux valeurs), des fonctions et relations sur ce domaine. Le langage de cette logique comporte plusieurs catégories : 
les termes qui représentent les éléments du domaine ou des fonctions sur ces éléments, des relations qui relient des termes 
entre eux et les formules qui décrivent les interactions entre les relations grâce aux connecteurs et aux quantificateurs. Par 
exemple, la relation mortel(x) désigne x est mortel, la relation homme(x) signifie que x est un homme. De plus, Socrate 
est une constante du domaine (c’est-à-dire, elle a pour valeur un élément du domaine) et homme(Socrate) signifie que 
Socrate est un homme. Enfin, la formule Vx (Aomme(x) = mortel(x)) indique que tous les hommes sont mortels. À partir 
de ces deux hypothèses, il est possible de conclure que Socrate est mortel (mortel(Socrate)) par différentes méthodes 


1. La notion de syllogisme fut introduite par Aristote et signifie littéralement « parole (qui va) avec (une autre) », aussi connu en latin par modus 
ponendo ponens = « manière d’affirmer, d’établir en affirmant » et plus brièvement modus ponens. 
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que nous détaillerons dans cette seconde partie. Ce même raisonnement s’ applique également pour prouver le syllogisme 
suivant : 


Un cheval bon marché est rare. 
Tout ce qui est rare est cher. 
Donc un cheval bon marché est cher. 


Malgré la conclusion qui semble contradictoire, le raisonnement est correct. Afin d’obtenir une contradiction il faut 
ajouter l’hypothèse suivante : Vx( bonmarché (x) & - cher (x)). Ceci traduit la relation communément admise entre la 
notion de bon marché et de cher, i.e., tout ce qui est cher n’est pas bon marché et réciproquement. Avec cette hypothèse 
supplémentaire nous pouvons montrer que ce raisonnement est contradictoire, sans cette hypothèse le raisonnement est 
correct. Ceci élucide le paradoxe de ce syllogisme. 

Notre objectif dans ce chapitre est d’introduire les concepts et notions élémentaires de la logique du premier ordre afin 
de pouvoir proposer des méthodes de raisonnement dans les chapitres suivants. 


Plan : Nous commençons par décrire la syntaxe de la logique du premier ordre. Puis, nous définissons les notions 
de libre et liée qui sont essentielles pour pouvoir interpréter le sens des formules. Ensuite nous définissons le sens des 
formules que nous pouvons construire à partir de la syntaxe introduite précédemment. Enfin, nous énonçons des propriétés 
remarquables de la logique du premier ordre, qui pourront être utilisées dans les raisonnements. 


4.1 Syntaxe 


Nous ajoutons à la logique propositionnelle deux symboles : le symbole existentiel (1) et le symbole universel (W). Le 
symbole existentiel signifie qu’il existe un élément ayant une certaine propriété alors que le symbole universel permet de 
parler de tous les éléments ayant une propriété. Ces changements impliquent qu’un élément de ce langage peut désormais 
dépendre de plusieurs variables. Il faut donc rajouter dans la syntaxe un délimiteur de variables. Nous avons choisi clas- 
siquement la virgule. Ces changements introduisent de nouveaux symboles en plus des variables, ces symboles peuvent 
par exemple être des nombres sur lesquels nous pouvons créer des fonctions (comme l’addition) ou encore définir des 
relations (comme l'égalité). Toutes ces modifications rendent la présentation de la syntaxe légèrement plus subtile que 
celle de la logique propositionnelle. 


4.1.1 Formules strictes 


Pour écrire les formules de la logique du premier ordre nous étendons la syntaxe de la logique propositionnelle, ainsi 
nous disposons du vocabulaire suivant : 
— Deux constantes propositionnelles : L et T représentant respectivement le faux et le vrai. 
— Variables : suite de lettres et de chiffres commençant par une des minuscules w,v,w,x, y, z. 
— Connecteurs : —,A,V,=,e. 
— Quantificateurs : V le quantificateur universel et 1 le quantificateur existentiel. 
— Ponctuations : la virgule «, » et les parenthèses ouvrantes « ( » et fermantes «) ». 
— Symbole : 
— ordinaire : suite de lettres et de chiffres ne commençant pas par une des minuscules u,v,w,x, y, Z. 
— spécial : +,—,x,/,=,2,<,<,>,> 
L'ensemble des symboles spéciaux peut être augmenté de nouveaux éléments, suivant les domaines mathématiques étu- 
diés, à condition de respecter la contrainte que ces nouveaux éléments ne soient pas dans les ensembles des constantes 
propositionnelles, des variables, des connecteurs, des quantificateurs, des ponctuations ou des symboles ordinaires. 


Exemple 4.1.1 Ci-dessous, nous illustrons ces notions : 

— x,x1,x2,y sont des variables, 

— homme, parent, succ, 12, 24, f1 sont des symboles ordinaires, les symboles ordinaires représenteront des fonc- 
tions (constantes numériques ou fonctions à plusieurs arguments) ou des relations (variables propositionelles ou 
relations à plusieurs arguments). 

— X= y, z > 3 sont des exemples d'application de symboles spéciaux. 


Nous définissons en toute généralité la notion de terme qui est essentielle en logique du premier ordre. Nous étendrons 
dans la suite cette notion en définissant ce qu’est un terme associé à un ensemble de symboles. 
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Définition 4.1.2 (Terme) Un terme est défini de manière inductive par : 
— un symbole ordinaire est un terme, 
— une variable est un terme, 
— siti,...,fh sont des termes et si s est un symbole (ordinaire ou spécial) alors s(f1,...,11) est un terme. 


Exemple 4.1.3 


sont des termes, par contre 


n’est pas un terme. Notons que 42(1,y,3) est aussi un terme, mais l’usage veut que les noms des fonctions et relations 
soient des symboles ordinaires commençant par des lettres. 


Définition 4.1.4 (Formule atomique) Nous définissons une formule atomique de manière inductive par : 
— T'et L sont des formules atomiques 
— un symbole ordinaire est une formule atomique 
— siti,...,f, sont des termes et sis est un symbole (ordinaire ou spécial) alors s(f,...,t,) est une formule atomique. 


Exemple 4.1.5 


sont des formules atomiques, notons également que 


ne sont pas des formules atomiques. 


Notons que l’ensemble des termes et l’ensemble des formules atomiques ne sont pas disjoints. Par exemple, p(x) est 
à la fois un terme et une formule atomique. Lorsque f est à la fois un terme et une formule atomique, nous distinguons [r] 


le sens de r vu comme un terme, de [r] le sens de f vu comme une formule (voir le paragraphe4.3.4 page 80). 


Définition 4.1.6 (Formule) Nous définissons une formule de manière inductive par : 
— une formule atomique est une formule, 
— si À est une formule alors —A est une formule, 
— si A et B sont des formules et si o est une des opérations V,A,—=,<8 alors (A o B) est une formule , 
— si À est une formule et si x est une variable quelconque alors Vx A et 2x À sont des formules 


Exemple 4.1.7 


sont des formules atomiques, donc des formules. Par contre 


est une formule qui n’est pas atomique. 


La notion de sous-formule (définition [T.T.4} s’étend naturellement à la logique du premier ordre. La notion de faille 
de formule stricte nécessite qu’en à elle une nouvelle définition : 


Définition 4.1.8 (Taille d’une formule) La taille d’une formule À, notée |A 
— |T|=0e|1|=0. 
— Si À est une formule atomique alors |A| — 0. 
— |-A|=1+lA|. 
— |Qx A] = 1+]A} si Q est un des quantificateurs V ou 3. 
— |(aoB)|=JAl+1B1+1. 


2. Attention, x peut ne pas exister dans À. 


, est définie inductivement par : 
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4.1.2 Formules à priorité 


Nous reprenons les priorités de la logique propositionnelle pour les connecteurs, et nous ajoutons une priorité iden- 
tique à celle de la négation pour les quantificateurs. Dans le tableau F.T]nous donnons les priorités des symboles et des 
connecteurs par ordre décroissant du haut vers le bas. Nous indiquons seulement deux règles de formation des formules à 
priorité, qui les distinguent des formules complètement parenthésées et permettent d’omettre des parenthèses ou d’ajouter 
des nouvelles parenthèses. 

Pour abréger l'écriture des termes, certains symboles de fonction +,—,x, / et certains symboles de relations —, #, < 
, <,>,2> peuvent être écrits de manière infixe, c’est-à-dire, de façon usuelle. 


Exemple 4.1.9 Nous abrégeons le terme +(x, *(y,z)) en x+yxzet < (x(3,x),+(y,5)) en 3+xx < y+5. La transformation 
inverse est définie en donnant aux symboles =,£,<,<,>,> des priorités inférieures à celle des symboles +,—,x*, /. 


OPÉRATIONS 
—+ unaire 

ki associatif gauche 
+,— binaire | associatif gauche 

RELATIONS 

=, 2, <,<,>,2> 
NÉGATION, QUANTIFICATEURS 
—,Ÿ,3 
CONNECTEURS BINAIRES 

A associatif gauche 
V associatif gauche 
> associatif droit 
& associatif gauche 


TABLE 4.1 — Priorités des connecteurs et symboles. 


Définition 4.1.10 (Formule à priorité) Une formule à priorité est : 
— Une formule atomique. 
— Si A est une formule à priorité alors —A est une formule à priorité. 
— Si A et B sont des formules à priorité alors À oB est une formule à priorité. 
— Si À est une formule à priorité et si x une variable quelconque alors Vx À et 2x À sont des formules à priorité. 
— Si À est une formule à priorité alors (A) est une formule à priorité. 


Exemple 4.1.11 La formule (à priorité) VxP(x) À VxQ(x) & Vx(P(x) A Q(x)) peut être vue comme une abréviation de la 
formule ((WxP(x) A VxQ(x)) & Vx(P(x) A Q(x))). 

La formule (à priorité) VxWyVz(x < yAy<2z= x < z) peut être vue comme une abréviation de la formule VxVyVz((< 
Gy)A < 0,2)) << (x,2)). 


Exemple 4.1.12 La priorité du V est plus forte que celle de =, dans la formule YxP(x) = Q(y). Donc, l’opérande gauche 
de l'implication est VxP(x). La structure de la formule sera ainsi représentée par l’arbre suivant : 


= 


FN 


H <— 5 <— < 
L <— © 
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De manière analogue à la logique propositionnelle, la taille d’une formule à priorité sera égale à la taille de la formule 
stricte dont elle est l’abréviation. De même, pour les sous-formules, nous considérerons toujours la formule stricte dont la 
formule à priorité est l’abréviation. 


4.2 Être libre ou lié 


Le sens de la formule x +2 = 4 dépend de x : la formule n’est vraie (en arithmétique) que si x — 2. La variable x est 
libre dans cette formule. 

Par contre, toujours en arithmétique Vx(x +2 = 4) est une formule fausse et x(x +2 — 4) est une formule vraie 
car 2 +2 — 4. Pour chacune de ces deux formules, il n’y a pas à choisir de valeur pour x afin de déterminer leur valeur 
respective : ces deux formules n’ont pas de variables libres. 


4.2.1 Occurrences libres et liées 


Sur une représentation en arbre, où nous dessinons les structures des formules en faisant apparaître Vx et x comme 
des sommets de l’arbre, une occurrence liée de la variable x est une occurrence en dessous d’un sommet -x ou Vx. Une 
occurrence de x qui n’est pas sous un tel sommet est libre. 


Définition 4.2.1 (Portée de liaison, occurrence libre, liée) Soient x une variable et À une formule. Dans une formule 
Vx À ou 2x À, la portée de la liaison pour x est À. Une occurrence de x dans une formule est libre si elle n’est pas dans la 
portée d’une liaison pour x, sinon elle est dite liée. 


Exemple 4.2.2 Pour voir les occurrences des variables, nous dessinons la structure de la formule VxP(x, y) À 2zR(x;2), 
puisque la priorité de V est supérieure à celle du \ nous obtenons : 


L'occurrence de x présente dans P(x, y) est liée, l'occurrence de x présente dans R(x,z) est libre. L'occurrence de z 
est liée. 


4.2.2 Variables libres et liées 


Définition 4.2.3 (Variable libre, liée, formule fermée) La variable x est une variable libre d’une formule si et seulement 
s’il y a une occurrence libre de x dans la formule. Une variable x est une Variable liée d’une formule si et seulement s’il y 
a une occurrence liée de x dans la formule. Une formule sans variable libre est aussi appelée une formule fermée. 


Remarque 4.2.4 Une variable peut-être à la fois libre et liée. Par exemple, dans la formule VxP(x) V Q(x), x est à la fois 
libre et liée. 


Remarque 4.2.5 Par définition, une variable qui n'apparaît pas dans une formule (0 occurrence) est une variable NON 
libre de la formule. 


Exemple 4.2.6 Les variables libres de la formule de l'exemplef.Z7]sont xety. 
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4.3 Sens des formules 


Dans la suite, nous définissons en logique du premier ordre, le sens des connecteurs, des quantificateurs ainsi que 
de l’égalité. Aussi, pour définir le sens d’une formule, il suffit d'indiquer la valeur des variables libres et le sens de ses 
symboles utilisés. Dans un premier temps nous expliquons comment nous déclarons un symbole. Ensuite nous introdui- 
sons la notion de signature qui permet de définir les termes et formules associés. Une fois toutes ces notions établies nous 
définissons les interprétations afin de donner du sens aux formules de la logique du premier ordre. 


4.3.1 Déclaration de symbole 


Afin de donner un sens aux formules de la logique du premier ordre il nous faut déclarer les symboles utilisés. Nous 
distinguons en plus des variables, les symboles de fonctions, par exemple g(x,y), et les symboles de relation comme 


parent (x, y). 


Définition 4.3.1 (Déclaration de symbole) Une déclaration de symbole est un triplet noté s8" où s est un symbole, g est 
soit f (pour fonction) ou r (pour relation), et n est un entier naturel dénotant le nombre d'arguments de ce symbole, n est 
aussi appelé l’arité de s. 


Exemple 4.3.2 Les fonctions d’arité O constituent les constantes, par exemple 1 et 2 sont des constantes d’arité nulle, 
mais parent’? est une notation signifiant que parent est employé comme relation d’arité 2. De même */? est une déclara- 
tion annonçant que * est une fonction 2-aire. Le symbole A" est d’arité 0 et signifie que A est une variable proposition- 
nelle. Le symbole homme"! est d’arité 1 ou unaire et le symbole gf? est d’arité 2 ou 2-aire. 


Remarque 4.3.3 Lorsque le contexte ou les conventions usuelles comportent une déclaration implicite d’un symbole, 
nous omettons l’exposant. Par exemple, le symbole égal étant toujours employé comme relation à deux arguments, nous 
abrégeons la déclaration de symbole —"? en —. 


4.3.2 Signature 


En logique du premier ordre nous pouvons choisir le nom des variables utilisées mais nous avons aussi la possibilité 
de construire nos propres constantes (fonctions sans arguments), fonctions, variables propositionnelles (relations d’arité 
nulle) et relations. Une signature est donc l’ensemble des déclarations de symboles autorisés pour construire des formules. 
Elle permet de définir les symboles dont le sens n’est pas fixé a priori, contrairement par exemple aux constantes T et L 
dont le sens est toujours fixé respectivement à 1 et 0. 


Définition 4.3.4 (Signature, constante, symbole de fonction, variable propositionnelle, et relation) Une signature X est 
un ensemble de déclarations de symboles de la forme s®". Soient n un entier strictement positif et Z une signature, le sym- 
bole s est : 


une constante de la signature si et seulement si s/0 € Y 
un symbole de fonction à n arguments de la signature, si et seulement si sf" EX 


une variable propositionnelle de la signature si et seulement si s° EX 


SN, SD ER 


un symbole de relation à n arguments de la signature, si et seulement sis" € X 


Au lieu de dire 0/0,1/0, +72 4/2 12 est une signature pour l’arithmétique, nous disons plus simplement qu’une 
signature possible pour l’arithmétique comporte 0, 1, + (à deux arguments), * et =. Sur cet exemple, nous devons préciser 
que le symbole plus est utilisé avec deux arguments (car nous pouvons aussi rencontrer le symbole plus avec un seul 
argument). 


Exemple 4.3.5 Une signature possible pour la théorie des ensembles est €,=. Notons que toutes les autres opérations 
sur les ensembles peuvent être définies à partir de ces deux symboles. 


Nous définissons maintenant les termes associés à une signature. Nous considérons un ensemble dénombrable de 
variables disjoint de l’ensemble de symboles de la signature. 


Définition 4.3.8 (Terme sur une signature) Soit Z une signature, un terme sur Z est : 
— soit une variable, 
— soit une constante s où s/0 € >; 


4.3. Sens des formules 79/129 


— soit un terme de la forme s(ti,...,fh), oùn > 1, sMEXett ,...,{n Sont des termes sur ». 
L'ensemble des termes sur la signature Z est noté 75. 


Définition 4.3.9 (Formule atomique sur une signature) Soit Z une signature, une formule atomique sur E est : 
— soit une des constantes T,1, 
— soit une variable propositionnelle s où s"° EX, 
— soit de la forme s(f1,...,t,)oùn > 1, s"€EZetoùti,...,t, sont des termes sur . 


Notons que les variables ne sont pas des formules atomiques. 


Définition 4.3.10 (Formule sur une signature) Une formule sur une signature est une formule, dont les sous-formules 
atomiques sont des formules atomiques sur Z (au sens de la définition[#.3.9). 


Nous dénotons l’ensemble des formules sur la signature Z par F. 


Exemple 4.3.11 Vx (p(x) = y q(x,y)) est une formule sur la signature 2 = {p"\,q"?,h!\,c/0}, Mais c’est aussi une 
formule sur la signature Z! = {p'!,q"?}, puisque les symboles h et c ne figurent pas dans la formule. 


Définition 4.3.12 (Signature associée à une formule) La signature associée à une formule est la plus petite signature Y 
telle que la formule est élément de F5, c’est la plus petite signature permettant d'écrire la formule. 


Exemple 4.3.13 La signature Z associée à la formule Vx (p(x) = 2y q(x,y)) est Z = {p'!,q"?}. 


Définition 4.3.14 (Signature associée à un ensemble de formules) La signature associée à un ensemble de formules est 
l’union des signatures associées à chaque formule de l’ensemble. 


Exemple 4.3.15 La signature Z associée à l’ensemble constitué des deux formules Vx(p(x) = 2y q(x,y)), Vu Vv (u + 
s(v) =s(u)+v) estE = {p'l,q2,492,5f1, =}. 


4.3.3 Interprétation 


En logique propositionnelle, le sens des formules est uniquement fixé par les valeurs des variables, en logique du 
premier ordre le sens des formules dépend aussi du sens des fonctions et des relations. Le sens des fonctions et des 
relations est fixé par une interprétation. 


Définition 4.3.16 (Interprétation) Une interprétation / sur une signature X est définie par un domaine D non vide et une 


application qui à chaque déclaration de symbole s8" € X associe sa valeur se comme suit : 


1. si0 est un élément de D. 


2. cs où n > 1 est une fonction de D" dans D, autrement dit une fonction à n arguments. 
3: 5 vaut 0 ou 1. 


4. sy oùn > 1 est un sous-ensemble de D", autrement dit une relation à n arguments. 


Exemple 4.3.17 Soit l'interprétation I de domaine D = {1,2,3} où la relation binaire ami est vraie pour les couples 
(1,2), (1,3) et (2,3), c'est-à-dire, ami? = {(1,2),(1,3),(2,3)}. ami(2,3) est vraie dans l'interprétation 1. En revanche, 
ami(2, 1) est fausse dans l'interprétation 1. 


Remarque 4.3.18 Dans toute interprétation I, la valeur du symbole — est l’ensemble {(d,d)|d € D}, autrement dit dans 
toute interprétation le sens de l’égalité est l'identité sur le domaine de l'interprétation. 


Exemple 4.3.19 Considérons une signature suivante. 
— Anne!, Bernard! et Claudef® : les prénoms Anne, Bernard, et Claude dénotent des constantes, 
a"? : la lettre a dénote une relation à deux arguments (nous lisons a(x,y) comme x aime y) et 
— cf; Ja lettre c dénote une fonction à un argument (nous lisons c(x) comme le copain ou la copine de x). 
Une interprétation possible sur cette signature est l'interprétation I de domaine D = {0, 1,2} où : 


— Annel° = 0, Bernard/° = |, et Claudel° —=?; 
_ ap ni {(0, 1}; (1,0), (2,0)}. 
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— cl (0) = 1,c/ (1) = 0,c! (2) = 2. Notons que la fonction cf! a comme domaine D, ce qui oblige à définir artifi- 
ciellement cl (2) : Claude, dénoté par 2, n’a ni copain, ni copine. 
Définition 4.3.20 (Interprétation d’un ensemble de formules) L'interprétation d’un ensemble de formules est une in- 
terprétation qui définit seulement le sens de la signature associée à l’ensemble des formules. 


Définition 4.3.21 (État) Un état e d’une interprétation est une application de l’ensemble des variables dans le domaine 
de l'interprétation. 


Définition 4.3.22 (Assignation) Une assignation est un couple (1,e) composé d’une interprétation I et d’un état e. 


Exemple 4.3.23 Soient le domaine D = {1,2,3} et l'interprétation I où la relation binaire ami est vraie uniquement 
pour les couples (1,2), (1,3) et (2,3), c’est-à-dire, ami? = {(1,2),(1,3),(2,3)}. Soit e l’état qui associe 2 à x et 1 à y. 
L’assignation (1,e) rend la relation ami(x, y) fausse. 


4.3.4 Sens des formules 


Nous expliquons maintenant comment évaluer une formule à partir d’une assignation, c’est-à-dire, une interprétation 
et un état. Il faut noter que dans certains cas, l’état de l’assignation est inutile pour fixer le sens d’une formule. 


Remarque 4.3.24 La valeur d’une formule ne dépend que de ses variables libres et de ses symboles, aussi pour évaluer 
une formule sans variable libre, l’état des variables est inutile. Nous avons alors deux possibilités : 

— Pour une formule sans variables libres, il suffit de donner une interprétation I des symboles de la formule. Dans 
ce cas, les assignations (1,e) et (1,e') donnerons la même valeur à la formule pour tous états e et e'. Ainsi pour 
tout état e, nous identifierons (L,e) et I. Selon le contexte, I sera considéré comme soit une interprétation soit une 
assignation dont l’état est quelconque. 

— Pour une formule avec des variables libres, nous avons donc besoin d’une assignation. 


Soient Z une signature, / une interprétation sur Z de domaine D et e un état de cette interprétation. Nous souhaitons 
connaître la valeur (0 ou 1) de toute formule A sur Z dans l’assignation (J,e). Cette valeur sera notée [A]{;.,. Pour cela, 
nous avons tout d’abord besoin de définir le sens de chaque terme f sur £ dans l’assignation (7,e), noté [r] (12). Ensuite 
nous devons fixer le sens de chaque formule atomique B sur E dans la même assignation, noté [B](1,e). 


4.34.1 Sens des termes sur une signature 


Chacun sait intuitivement comment évaluer un terme : nous remplaçons les variables par leurs valeurs, les symboles 
de fonctions par les fonctions qui leur sont associées et nous appliquons les fonctions. Mais pour raisonner sur le sens des 
termes ou écrire un programme d’évaluation des termes, nous devons formaliser cette évaluation. 


Définition 4.3.25 ( Évaluation) Nous donnons la définition inductive de l'évaluation d’un terme t : 


1. sit est une variable, alors [f](1e) = e(t), 


2. sit est une constante alors [] (1e) — de 
3. sit =s(f,...,1,) où s est un symbole etti,...,1, sont des termes, alors [f] (1e) — s"([rtre lue) 
Dans les exemples, nous remplaçons les variables par leurs valeurs, nous confondons les symboles et leur sens. 


Exemple 4.3.26 Soit la signature af, f!?,gf?. 
Soit I l'interprétation de domaine N où : 
— a=l; 
— ff est le produit ; 
#2 
— g, est la somme. 
Soit e l’état tel que x —2,y —3. Calculons [f(x,g8(y,a))] (1e) 
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4.3.4.2 Sens des formules atomiques sur une signature 
Définition 4.3.27 (Sens des formules atomiques) Le sens des formules atomiques est donné par les règles inductives 
suivantes : 


1 [Tle) = 1,[L]ue) = 0. Dans les exemples, nous autorisons à remplacer T par sa valeur 1 et L par sa valeur 0. 


2. Soit s une variable propositionnelle, [s](1e) — sp. 


3. Soit A =s(t1,...,f) où s est un symbole etti,.….,f, sont des termes. Si ([fi]{1e);---; [tn] (re) € sÿ" alors [A](1e) = 1 
sinon [A](1,e) = 0. 


Remarque 4.3.28 Nous devons distinguer entre évaluer un terme | ] et évaluer une formule atomique | |, car dans notre 
présentation, ces deux catégories syntaxiques ne sont pas disjointes, car s(f1,...,f,) peut être l'application d’une fonction 
([]) ou d’une relation ([]). Mais quand le contexte est sans ambiguïté, nous pouvons omettre cette distinction. 


Exemple 4.3.29 En reprenant l'exempleff.3.T9 page 70] nous obtenons : 
— [a(Anne, Bernard)\; — 


— [a(Anne,Claude)|; = 


Soit e l’état x = 0,y = 2. Nous avons : 


_ [a(x,c(x))l(1e) = 


— [a(y,c(y))l(re) = 


Attention à distinguer (suivant le contexte), les éléments du domaine 0, 1 et les valeurs de vérité 0, 1. Les exemples suivants 
mettent en évidence l'interprétation de l'égalité comme une identité. Dans l'interprétation I, nous avons : 
— [(Anne = Bernard)]; = 


— [(c(Anne) = Anne)]; = 


— [(c(c(Anne)) = Anne)|; = 


4.3.4.3 Sens des formules sur une signature 

Nous pouvons maintenant ajouter le sens des quantificateurs et aussi celui des opérateurs qui reste identique à celui 
donné pour la logique propositionnelle (cf. sous-section[T.7.T page T4). 
Définition 4.3.30 (Sens des formules) Le sens des formules est donné par : 


1. Les connecteurs propositionnels ont le même sens qu’en logique propositionnelle. Soient B et C des formules, 
rappelons uniquement le sens de l'implication : si [B]{,.) —0 alors [(B— C)\(1e) = 1 sinon [(B = C}J{1e) = [Cl(re) 
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2. Soient x une variable et B une formule. [VxB|(1e) = 1 si et seulement si [B](,5) — 1 pour tout état f identique à e, 
sauf pour x. Soit d € D. Notons e[x — d] l’état identique à l’état e, sauf pour la variable x, auquel l’état e[x = d] 
associe la valeur d. La définition ci-dessus peut être mise sous la forme suivante : 


(VxB](1,e) = minaeplBl(1eu=a) = [ [lBlaeu=d)): 
deD 
où le produit est le produit booléen. 
Cette définition permet de calculer la valeur de VxB dans le cas où D est un domaine fini. Mais quand D n’est pas 
un domaine fini, c’est seulement une traduction du quantificateur universel d’un formalisme dans un autre. 


ES 


xB](1,e) = 1 si et seulement s’il y a un état f identique à e, sauf pour x, tel que [B] «,p) = 1. La définition ci-dessus 
peut être mise sous la forme suivante : 


BxB,e) = maxaen[B\(1ex=a)) = À Blaex=d})» 
deD 


où la somme est la somme booléenne. 


Exemple 4.3.31 Soit l'interprétation I de domaine D = {1,2,3} où la relation binaire ami est vraie pour les couples 
(1,2), (1,3) et (2,3), c'est-à-dire, ami? = {(1,2),(1,3),(2,3)}. La formule ami(1,2) A ami(2,3) = ami(1,3) est vraie 
dans l'interprétation I, ï.e., [ami(1,2) A ami(2,3) = ami(1,3)]r = 1. 


Exemple 4.3.32 Utilisons l'interprétation 1 donnée dans l'exemple F.3.T9 page 70] D'après le sens du quantificateur 
existentiel, nous devons évaluer a(x,x) pour x = 0, x = 1, et x = 2. Nous simplifions ce calcul et les calculs suivants en 
remplaçant immédiatement les variables par leurs valeurs : cela nous évite d'utiliser les états. 

2x a(x,x)l1 = 


— My al,p)}r = min{max{[e(0,0)}z, [a(0, Dr, (a(0,2)}r}, max{la(1,0)), [a(i, 1, [a(1,2)1r}, max{[a(2,0)}r, 
la(2,1)]r, [a(2,2)];}} = min{max{0,1,0}, max{1,0,0}, max{1,0,0}} = min{1,1,1} = 1. 
D'après la définition, nous avons : Mx2y a(x,y)]r = ([a(0,0)]r + [a(0,1)]r + [a(0,2)];). ([a(1,0)]5 + fa(1,1)]r + 
a(1,2)}r). ([a(2,0)}5 + [a(2,1)]r+ [a(2,2)}r) = (0+1+0).(1+0+0).(1+0+0) = 1.1.1 = 1. 


yVx ax, y)l1 = 


Remarque 4.3.33 Dans l'interprétation ci-dessus, les formules Vx2y a(x,y) et 2yVx a(x,y) n'ont pas la même valeur 
Donc en intervertissant un quantificateur existentiel et un quantificateur universel, nous ne préservons pas le sens des 
formules. 


4.3.5 Modèle, validité, conséquence, équivalence 


Ces notions sont définies comme en logique propositionnelle. Mais alors qu’en logique propositionnelle, une assi- 
gnation est une application des variables propositionnelles dans 0, 1, en logique du premier ordre une assignation est un 
couple constitué d’une interprétation des symboles d’une part et de l’état des variables d’autre part. 


4.3.6 Instanciation 


Définition 4.3.34 (Instanciation) Soit x une variable, t un terme et À une formule. 


1. A<x:=t> est la formule obtenue en remplaçant dans la formule À toute occurrence libre de x par le terme t. 
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2. Le terme t est libre pour x dans À si les variables de t ne sont pas liées dans les occurrences libres de x dans À. 


Exemple 4.3.35 Le terme z est libre pour x dans la formule 2yp(x, y). Par contre le terme y, comme tout terme comportant 
la variable y, n’est pas libre pour x dans cette formule. Soit A la formule (VxP(x) V Q(x)), la formule A<x := b> vaut 


Théorème 4.3.36 Soient À une formule et t un terme libre pour la variable x dans À. Soient I une interprétation et e un 
état de l'interprétation. Nous avons [A<x :=t>|](1e) = [Al(1ex=ay Où d = [fl (1e). 


Autrement dit, la valeur de A<x :=f> dans une assignation est la même que celle de À dans une assignation identique, 
sauf qu’elle donne à x la valeur du terme f. Ce théorème, dont le résultat est évident, peut être prouvé par une récurrence 
(que nous ne ferons pas) sur la taille des formules. Nous montrons seulement que la condition sur f est indispensable en 
observant un exemple où cette condition n’est pas respectée. 


Exemple 4.3.37 Soient I l'interprétation de domaine {0,1} avec pr = {(0,1)} ete, un état où y = 0. Soient À la formule 
Zyp(x, y) et t le terme y. Ce terme n’est pas libre pour x dans À. Nous avons : 
— A<X:=y>= 


et [A<x = Y>lue) = 


Soit d = [fl{re) = [ylte) — 0. Dans l’assignation (L,e[x — d]), nous avons x — 0. Donc, nous obtenons : 
[A] (Lelx=d]) — 


Ainsi, [A<x := t>l(1e) Z [A] (Lelx=d]) POUT d=fr] (Le)- 


Corollaire 4.3.38 Soient À une formule et t un terme libre pour x dans A. Les formules VxA = A<x:=t> et A<x := 
1>— 2xA sont valides. 


Ce corollaire est une conséquence immédiate du théorème précédent. 


4.3.7 Interprétation finie 


Nous montrons comment rechercher des modèles finis de formules fermées (c’est-à-dire sans variables libres). Un 
modèle fini d’une formule fermée est une interprétation de la formule de domaine fini, qui rend vraie la formule. Il est 
clair que le nom des éléments du domaine est sans importance, aussi quand nous cherchons un modèle avec un domaine 
de n éléments, le domaine que nous utiliserons, sera celui des entiers (sous-entendu naturels) inférieurs à n. Pour savoir 
si une formule fermée a un modèle de domaine {0,...,n — 1}, il suffit d’énumérer toutes les interprétations possibles de 
la signature associée à la formule et d'évaluer la formule pour ces interprétations. Mais cette méthode est inutilisable en 
pratique, car le nombre de ces interprétations est énorme. Soit une signature avec une constante, un symbole de fonction 
à un argument et un symbole de relation à deux arguments (plus éventuellement l’égalité de sens fixé), sur un domaine à 
5 éléments, cette signature à 5 x 5° x 22° — 524288000000 interprétations. Aussi nous montrons d’abord, comment dans 
le cas où une formule n’a aucun symbole de fonction et aucune constante, sauf des représentations d’entiers inférieurs à 
n, nous pouvons rechercher ses modèles à n éléments par réduction au cas propositionnel. En présence de symboles de 
fonctions et de constantes, nous pouvons en énumérer leurs valeurs, puis appliquer les méthodes ci-dessous. Pour trouver 
des énumérations intelligentes, nous conseillons de lire le manuel de Prover9 P21. 


4.3.7.1 Les entiers et leurs représentations 


Nous distinguons dans la suite un entier n et sa représentation n. Par exemple l’entier 3 peut être représenté en base 10 
par 3, en base 2 par 11, en chiffres romains par IL, en chiffre grec par y. Par habitude, nous choisissons la représentation 
en base 10. Dans la suite, de façon implicite, toutes les interprétations considérées donnent à la représentation d’un entier, 
la valeur de l’entier représenté. 
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4.3.7.2 Expansion d’une formule 


Dans certains cas il est suffisant de regarder les expansions de taille finie afin de trouver un modèle ou un contre- 
modèle pour une formule donnée. 


Définition 4.3.39 (7-expansion ) Soient À une formule et n un entier. La n-expansion de À est la formule qui consiste à 
remplacer toute sous-formule de À de la forme VxB par la conjonction (T];:, B<x := i>) et toute sous-formule de A de la 
forme =xB par la disjonction (Y;., B<X:=i>) où i est la représentation décimale de l’entier i. 


Exemple 4.3.40 La 2-expansion de la formule 2xP(x) = YxP(x) est la formule 


Théorème 4.3.41 Soient n un entier et À une formule ne comportant que des représentations d’entiers de valeur inférieure 
à n. Soit À’ la n-expansion de A. Toute interprétation de domaine {0,...,n— 1} attribue la même valeur à À et à A’. 


La condition sur À est nécessaire car si À comporte une représentation d’un entier au moins égal à n, la valeur de cette 
représentation ne sera pas dans le domaine de l’interprétation. La preuve du théorème est une récurrence sur la taille des 
formules, que nous ne ferons pas. Nous nous contentons de montrer que l’élimination d’un quantificateur universel de la 
formule VxB conserve la valeur de cette formule. 

Soient (1,e) une interprétation et un état de domaine {0,...,n — 1} donnant à la représentation d’un entier, la valeur 
de l’entier représenté. Par définition du sens du quantificateur universel : [VxB](7e) = [i<[Bl(1ex-1). D’après le théo- 
rème Re re penr le fait que la valeur de la représentation de l’entier à est à, nous avons : [B]{ex=1) = [B< 

Le). Par suite : [Vxb 


X:—1>1](1e): (Le) — Ii, [B<x — D>](1e) = [in B<x — i>](1e)- 


4.3.7.3 Interprétation et assignation propositionnelle 


Soient n un entier et À une formule fermée, sans quantificateur, sans égalité, sans symbole de fonction, sans constante 
sauf des représentations d’entiers inférieurs à n. Soit P l’ensemble des formules atomiques de À (sauf T et L dont le sens 
est fixé). 


De l’assignation à l’interprétation. 
Théorème 4.3.42 Soit v une assignation propositionnelle de P dans {0,1} alors il existe une interprétation I de À telle 
que [A]; = [A},. 
Preuve : Soit v une assignation propositionnelle de P dans {0,1}. Soit J l’interprétation suivante de À : 
1. Domaine : {0,...,n—1} 
2. 55 — v(s) si et seulement si s € P 
3. Soit p > 1 ets’? un symbole de relation de À . Alors 59° — {(k1,...,kh)|s(ki,.…..,kp) € P et v(s(ki,.…,kp)) = 1} 


Par définition de J, l’assignation v et l’interprétation 7 donnent la même valeur aux sous-formules atomiques de A, donc 
(par récurrence sur les formules) la même valeur à la formule À. 


Exemple 4.3.43 L'assignation v, définie par p(0) = 1 et p(1) — 0, donne la valeur 0 à la formule suivante : 
(p(0)+p(1)) = (p(0).p(1)). 


Donc I définie par p; = {0} donne aussi la valeur 0 à cette même formule. Cet exemple montre que v et I sont deux façons 
analogues de présenter une interprétation, la deuxième étant souvent plus concise. 


De l'interprétation à l’assignation. 
Théorème 4.3.44 Soit I une interprétation de À alors il existe une assignation v de P telle que 
[A]: = [AÏ,. 


Preuve : Soient J une interprétation de À et v l’assignation propositionnelle suivante de P dans {0,1} : pour tout BE P, 
v(B) = [B]r. Par définition de v, l’assignation v et l’interprétation 7 donnent la même valeur aux sous-formules atomiques 
de À, donc la même valeur à la formule A. 
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43.74 Recherche d’un modèle fini d’une formule fermée 


Formule fermée sans symbole de fonction : Soit À une formule fermée sans symbole de fonction ni constantes, sauf des 
représentations d’entiers de valeur inférieure à n. Pour trouver une interprétation ? modèle de À de domaine {0,...,n—1} 
donnant à la représentation d’un entier, la valeur de l’entier représenté, nous procédons ainsi : 


1. Nous remplaçons À par sa n-expansion B. 


2. Dans la formule B, nous remplaçons les égalités par leur valeur, c’est-à-dire que i = j est remplacée par 0 si i £ j 
et par 1 sii = j. De plus, nous recommandons d’éliminer ces valeurs de vérité par les identités x+0 = x, x+1—1, 
xx0 = 0, xx 1 = x. Soit C la formule obtenue après ces remplacements et simplifications. 


3. Nous cherchons une assignation propositionnelle v des formules atomiques de C, qui soit modèle de C : si une 
telle assignation n’existe pas, À n’a pas de modèle, sinon l’interprétation 7 déduite de v comme il est indiqué dans 


le théorèmel{.3.42 page précédentelest modèle de À. 


Prouvons la correction de cette méthode : 


1. Supposons qu’il n’y ait pas d’assignation propositionnelle modèle de C, mais que À ait un modèle 7. D’après le 


théorème I'est modèle de B, donc de C, et d’après le théorème}H.3.44 page précédentel il y 
a une assignation propositionnelle modèle de C. De cette contradiction, nous déduisons que À n’a pas de modèle 
à n éléments. 


2. Supposons que l’assignation propositionnelle v soit modèle de C. Donc, l'interprétation Z construite comme il est 
indiqué dans le théorème est modèle de C, donc elle est modèle de B, donc aussi d’après le 


théorèmel.3.41 page précédente] elle est modèle de A. 


Exemple 4.3.45 Soit À la formule 2xP(x) A 2x=P(x) A VxVy(P(x) A P(y) = x = y). Il est clair que cette formule n’a pas 
de modèle à un élément car cet élément devrait vérifier à la fois la propriété P et sa négation. La 2-expansion de À est : 


Formule fermée avec symbole de fonction : Soit À une formule fermée pouvant comporter des représentations d’en- 
tiers de valeur inférieure à n. Comme dans le cas précédent, nous remplaçons À par son expansion, nous supprimons les 
égalités. Puis, nous énumérons les choix des valeurs des symboles comme dans l’algorithme DPLL, en propageant le plus 
possible chacun des choix effectués. 


Exemple 4.3.46 Soit À la formule 2y P(y) = P(a), dont nous cherchons un contre-modèle à 2 éléments (cela revient au 
même que de trouver un modèle de la négation de A). 
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Exemple 4.3.47 Nous cherchons un modèle à 2 éléments des formules P(a), Vx(P(x) = P(f(x))), -P(f(b)). 


4.3.8 Substitution et remplacement 


La propriété de substitution et la propriété de remplacement déjà énoncées en logique propositionnelle (voir [L3.1] 
Ge Dci] 3.10 page 21] s’étendent à la logique du premier ordre} Plus précisément l’application d’une substitution 
à une formule propositionnellement valide donne une formule valide. Par exemple soit 6 la substitution propositionnelle 
telle que o(p) = Vx q(x). Puisque la formule p V -p est valide, il en est de même de la formule ô(p V -p) = Vx q(x) V 
—Vx q(x). Le principe de remplacement s’étend aussi avec le même énoncé de la logique propositionnelle à la logique du 
premier ordre car il est déduit des propriétés élémentaires suivantes. Pour toutes formules À et B et toute variable x : 

(A < B) = (VxA < VxB). 
(A B) EH (A4 8 AB). 


4.4 Équivalences remarquables 


Dans cette section, nous donnons les règles permettant de simplifier les formules de la logique du premier ordre. 
Remarquons que les règles de simplifications de la logique propositionnelle sont bien entendu encore appliquables au 
premier ordre. 


4.4.1 Relation entre V et = 
Lemme 4.4.1 Soient A une formule et x une variable. 
1. —VxA = 7x-A. 


3. Notons que dans le livre de Stephen Cole Kleene [T9], cette notion de substitution sur les variables propositionnelles est étendue à une substitution 
plus générale applicable à tous les symboles de relation. 
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2. VxA = -2x-A. 
3. —2xA = Vx-A. 


4. 2xA = -Vx-A. 


Prouvons les deux premières identités, les deux autres sont données en exercice[78 page 92]: 
1. Soient / une interprétation de domaine D et e un état. 
Evalus. = Î- (VxA] (1e) 
1—[iepA(ex=d)) d’après le sens de V 
= Xyp(i- Alretx=a)) par les lois de De Morgan généralisées 


LaeplAl(elx=d}) par définition du sens de — 


2x-A] (1e) par définition du sens de = 


En examinant de façon critique cette preuve, nous voyons qu’elle utilise la loi de De Morgan généralisée, qui 
est l’expression dans un autre formalisme d’une loi analogue. Il faut donc formaliser l’usage des quantificateurs 
pour échapper à ces preuves qui ne sont en fait que des changements de notations. Nous le ferons en ajoutant à la 
déduction naturelle des règles qui gouvernent les quantificateurs. 
2. Les autres équivalences sont prouvables à partir de la première par le principe de remplacement. Nous ne prouvons 
que la deuxième identité : 
VxA =  —-VxA identité de la double négation 


= —2x-A par l’identitéll page précédente 


44.2 Déplacement des quantificateurs 


Nous donnons, sans preuve, des équivalences qui s’appliquent à toutes les formules (avec ou sans variable libre) et qui 
permettent de retrouver les lois usuelles de déplacement des quantificateurs. Nous supposons ci-dessous que x, y sont des 
variables et que À,B sont des formules. 


1. VxvyA = VyVxA. 


2. 2x1yA = 2y-xA. 

3. Vx(A AB) = (VxA A VxB). 

4. =x(AVB)= (2xA V xB). 

5. Soient Q un des quantificateurs V,1, et o une des opérations AÀ,V,—. Supposons que x ne soit pas une variable 
libre de A. 
(a) OxA = A, 


(b) Qx(AoB)= (A0 OQxB). 


Exemple 4.4.2 Nous éliminons de ces deux formules les quantificateurs inutiles : 


— VxaxP(x) = 


— Vx(ExP(x) V Q(x)) = 


44.3 Changement de variables liées 


Théorème 4.4.3 Soit Q un des quantificateurs V,2. Supposons que y soit une variable qui ne figure pas dans OxA alors : 
QxA = OyA<x := y>. 


Exemple 4.4.4 La formule Vx p(x,z) est équivalente à la formule Vy p(y,z) (d’après le théorème ci-dessus) mais elle 
n’est pas équivalente à la formule Vz p(z,1), où le changement de variable ne respecte pas les conditions du théorème. 
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Définition 4.4.5 (Formules égales à un changement près de variables liées) Deux formules sont égales à un change- 
ment près de variables liées si nous pouvons obtenir l’une à partir de l’autre par des remplacements de sous-formules 
de la forme QxA par QyA<x := y> où Q est un quantificateur et y est une variable qui ne figure pas dans QxA. Deux 
formules égales à un changement près de variables liées, sont dites aussi copies l’une de l’autre ou encore o-équivalentes. 


Théorème 4.4.6 Si deux formules sont égales à un changement près de variables liées alors elles sont équivalentes. 


Ce résultat est clairement une conséquence du théorèmel.4.3 page précédente| Nous n’en ferons pas la preuve, qui est 
longue et fastidieuse. Nous nous contentons de suggérer cette preuve à l’aide d’un exemple. 


Exemple 4.4.7 Nous montrons que les formules Vx2yP(x, y) et Vy2xP(y,x) sont égales par changement des variables 
liées, au sens de la définition donc sont équivalentes, en effet : 


Notre définition de l’égalité entre deux formules à un changement près de variables liées n’est pas pratique, car la 
définition ne donne pas un test. Or il est simple de voir si deux formules sont égales à un changement près de variables 
liées : nous traçons des traits entre chaque quantificateur et les variables qu’il lie et nous effaçons les noms des variables 
liées. Si après cette transformation, les deux formules deviennent identiques, c’est qu’elles sont égales à un changement 
près des variables liées. 


Exemple 4.4.8 Les deux formules Vx2yP(y, x) et Vy2xP(x, y) sont transformées en V|3|P(|, |). 
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4.5 Exercices 


Exercice 64 (Structure et variables libres) 
Pour chaque formule ci-dessous, indiquer sa structure et ses variables libres. 


1. Vx(P(x) = 3yQ(x,y)). 
VaVb(b £0 = q3r(a = b+q+rAr <b))f] 
Pair(x) & Zy(x =2%+ y). 


x Divise y 2z(y = zx x). 


nm À & D 


Premier(x) & Vy(y Divise x = y = 1V y = x). 


Exercice 65 (Formalisation, symbole de fonction et de relation) Nous considérons 2 = { f"?,0"?,c"?, j"?,r/0, pfl} la 


signature ayant la sémantique donnée ci-dessous. 


— f(x,y) : x est frère de y. 

— o(x,y) : x est l'oncle de y. 

— c(x,y) : x est le cousin de y. 

— j(x,y) : x est plus jeune que y. 

— rest le diminutif de Robert. 

— p(x) est le père de x. 

Exprimer en logique du premier ordre et en utilisant la signature Y les phrases suivantes : 
1. Tout frère du père de Robert est un oncle de Robert. 

2. Si les pères de deux enfants sont des frères alors ces deux enfants sont des cousins. 

3. Robert a un cousin plus jeune qu'un des frères de Robert. 


Exprimer en français les propositions logiques suivantes : 


1. Ax j(p(x);x) 


2. VxVy(p(p(x)) = p(p(y)) = c(x,y)) 
3. Vay(f(x,y) A j(x,>)) 
4. y(f(x,y) A -(p(x) = p(y))) 


Exercice 66 (Formalisation) Considérons la signature 2 = {a/, f/0,7"2,G'?}, où les symboles ont le sens donné ci- 


dessous. 


— a: l’équipe d'Allemagne. 

— f: l’équipe de France. 

— J(x,y) : x a joué un match contre y. 

— G(x,y) : x a gagné contre y. 

Exprimer en logique du premier ordre en utilisant la signature Ÿ les assertions suivantes : 


1. L'équipe de France a gagné un match et en a perdu un. 

2. L'équipe de France et l’équipe d'Allemagne ont fait match nul. 
3. Une équipe a gagné tous ses matchs. 

4. Aucune équipe n'a perdu tous ses matchs. 


5. Considérons l’assertion suivante : « Tous ceux qui ont joué contre une équipe qui a gagné tous ses matchs, ont 
gagné au moins un match ». Parmi les formules suivantes, lesquelles expriment la phrase ci-dessus, et lesquelles 
sont équivalentes ? 


(a) Vxdy(J(x,y) AVz(J (5,2) = G(v,2)) = 2vG(x,v)). 
(b) Vx(2y (J(x, y) AVz(J 6,2) = G(5,z))) = 2vG(x, v)). 
(c) x(Vy (J(x, y) = Gx,y)) = Vz(J(x, 2) = 2vG(x,v))). 
(d) VxVy(J(x,y) AVz(J (5,2) = G(v,2)) = 2vG(x,v)). 

(e) Va(Vy (J(x, y) AVz(J(,2) = G(y,2))) = 2vG(x,v)). 


4. Afin de respecter la notation usuelle pour la division euclidienne nous prenons exceptionnellement a, b, qg et r comme nom de variable. 


90/129 Chapitre 4. Logique du premier ordre 


Exercice 67 (Formaliser,**) Soient les constantes s pour Serge, t pour Tobby et les symboles de relation A(x, y), x aime 
y, C(x), x est un chien, D(x), x est un animal domestique, E(x), x est un enfant, O(x), x est un oiseau et P(x,y), x a peur 
de y, donner la signature Z associée à ces symboles. Formaliser en logique du premier ordre en utilisant X les énoncés 


suivants : 

1. Les chiens et les oiseaux sont des animaux domestiques. 
Tobby est un chien qui aime les enfants. 
. Les oiseaux n'aiment pas les chiens. 
Serge aime tous les animaux domestiques sauf les chiens. 
Tous les enfants n’ont pas peur des chiens. 
Certains chiens aiment les enfants. 


Certains chiens aiment les enfants et réciproquement. 


D N OS À & D 


Les enfants aiment certains chiens. 


Exercice 68 (Évaluer des prédicats unaires) Soit I l'interprétation de domaine D = {0,1} telle que Pr = {0}, Q1 = {1}. 


1. Évaluer dans cette interprétation les formules VxP(x) et Vx(P(x) V Q(x)). 

Les formules VxP(x) V VxQ(x) et Vx(P(x) V Q(x)) sont-elles équivalentes ? 

Évaluer dans cette interprétation les formules xP(x) et =x(P(x) A Q(x)). 

Les formules 2xP(x) A xQ(x) et 2x(P(x) À Q(x)) sont-elles équivalentes ? 

Évaluer dans cette interprétation les formules Vx(P(x) = Q(x)) et VxP(x) = VxQ(x). 
Les deux formules Vx(P(x) = Q(x)) et VxP(x) = VxQ(x) sont-elles équivalentes ? 


SN MR S D 


Exercice 69 (Interprétation,*) Nous donnons les formules suivantes : 


1. Vxdy(y = x +1). 
2. yVx(y =x+1). 
3. Vxy(y =x+1) = x =x+1). 
4. Vxdy(x = y +1). 
5. xVy(y =x+ y). 


6. =x(x ZOAXx+x = x). 
Nous donnons les interprétations suivantes : 
1. II est l'algèbre de Boole sur {0,1}. 


2. 12 est l’arithmétique usuelle sur les entiers naturels. 


= 


B3 est l’arithmétique usuelle sur les entiers relatifs. 


# 


est l’union d’ensembles. 


Indiquer si ces interprétations sont des modèles ou des contre-modèles des formules ci-dessus. 


Exercice 70 (Prédicat unaire et égalité) Soit I l'interprétation de domaine D = {0,1,2} telle que : 
{1,2},R; = {}. Évaluer dans cette interprétation les formules suivantes : 


Lu J 
7 
= 
% 
> 


nm & & D 
F 
RS 
7 


5. Cette formule signifie qu’il y a un et un seul élément vérifiant P. 


Pr = {0,1},Qr = 


14 est l'algèbre de Boole de domaine P(X) où les constantes 0 et 1 dénotent les ensembles 0 et X et où l'addition 


(nl 


4.5. Exercices 
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x (P(x) A Q(Xx) A Vy(PG)AQ0) = x = y)). 


Exercice 71 (Évaluation, égalité) Nous utilisons le symbole de fonction unaire f et la constante a. Nous abrégeons 


—(x= y) en x £ y. Soient 11, b les interprétations suivantes de domaine {0,1,2} : an = ar, = 0. 


fn @) | fn) 


NIRRSIRS 


0 1 
0 2 
2 ) 


Dans l'interprétation 1; puis dans L, évaluer les formules suivantes : 


f{a) = a. 
2. f(f(a)) a 
3. SU (a) =a 
4. 2x(f(x) = x), f a un point-fixe. 
5. (UE) =). 
6. Vy=x(f(x) = y), f est surjective. 
7. VaWy( f(x) = ff) = x = y), f est injective. 
8 HG) = FO) Ax 2»). 


Exercice 72 (Formalisation et évaluation) Nous adoptons les notations suivantes : 
— Anatoli, Boris, Catarina et Denka sont des constantes du domaine, 
— P(x) signifie que x a réussi son examen, 
— Q(x,y) signifie que x a téléphoné à y. 


Donner la signature associée à ces notations et traduire en formules les énoncés suivants : 


1. Quelqu'un a raté l'examen et n’a été appelé par personne. 
2. Tous ceux qui ont réussi à l’examen ont été appelés. 
3. Personne n’a appelé tous ceux qui ont réussi à l’examen. 


4. Tous ceux qui ont appelé quelqu'un, ont appelé quelqu'un qui a réussi l’examen. 


Soit l'interprétation ayant pour domaine D = {0,1,2,3}. Anatoli, Boris, Catarina et Denka valent respectivement 0, 1, 
2et3 dans l'interprétation. Anatoli et Boris sont des garçons et Catarina et Denka sont des filles. Dans cette interprétation 
seuls Boris et Catarina ont réussi l’examen, les garçons ont appelé les filles, Denka a appelé Boris, Catarina a appelé 


Denka et ce sont les seuls appels. 


Nous demandons de définir formellement l'interprétation donnée ci-dessus, puis de donner la valeur des énoncés 


précédents dans cette interprétation. 


Indication : pour faciliter le calcul de la valeur, nous suggérons de dessiner l'interprétation en entourant les prénoms des 


personnes qui ont réussi leurs examens, et en mettant une flèche de x vers y si x a téléphoné à y. 


Exercice 73 (Expansion et contre-modèle) Trouver, par la méthode des expansions, des contre-modèles des formules 


suivantes : 


nm &8 & D 


VxZyR(x,y) = 2xR(x, x). 
6. VxVy(R(x, y) = R(y,x)) = VxR(x, x). 


Indication : il suffit de construire des 1 ou 2 expansions. 


Exercice 74 (Raisonnement incorrect) Considérons les hypothèses suivantes : 


92/129 Chapitre 4. Logique du premier ordre 


1. 2xP(x). 

2. xQ(x). 

3. Vx(P(x) A Q(x) = R(x)). 
Montrer, en utilisant la méthode des expansions, qu'il est incorrect de déduire à partir de ces trois hypothèses la conclu- 
sion suivante : AxR(x). 


Exercice 75 (Contre-modèles avec relation) Construire des contre-modèles des formules suivantes, où F est une rela- 
tion : 


Vady(x = y) = yVx(y = x). 
F(a)A(aZ£b) = -F(b). 
DFA FO) Aa 23) = VF (x). 
. VxVy(F(x,y) = x = y) = xF (x, x). 


» SRE 


Exercice 76 (Contre-modèles avec fonction) Construire, en utilisant la méthode des expansions, des contre-modèles 
des formules suivantes, où f est une fonction et P une relation : 


1. Vyx( f(x) = y). 
2. VxVy 
3. xVy 
4. Vx(P(x) = P(f(x)). 


Exercice 77 (Équivalences) Prouver que : 

1. —VaxyP(x, y) = 2yVx-P(y, x). 

2. x(P(x) = Q(x)) = VxP(x) = xQ(x). 

3. La phrase « aucun malade n'aime les charlatans » a été traduite en logique du premier ordre par deux étudiants 
par les 2 formules suivantes : 
— VV ((M(x) AA(x,>)) = =C 0). 
— M) À BAG») A CE). 
Montrer que ces étudiants disent la même chose, c’est-à-dire les deux formules associées aux traductions sont 
équivalentes. 


TS 


Exercice 78 (°®, Preuve,*) Prouver les deux équivalences suivantes du lemme N 
— —2xA = Vx-A. 
2xA = -Vx-A. 


Conseil : utiliser les propriétés[T page 86]etE page 87du lemmeF.ÆT page 86] 
Exercice 79 (Preuve) Nous savons que (Vx(A A B)) = (A A (VxB)) à la condition que x ne soit pas une variable libre de 


À comme il est dit au paragraphe 7.7 page 87| Montrer que cette condition est nécessaire en donnant une assignation 
qui donne des valeurs différentes aux deux formules Vx(P(x) À Q(x)) et P(x) A (VxQ(x)). 


Chapitre 5 


Base de la démonstration automatique 
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Il L est important de préciser que la logique du premier ordre est indécidable, cela signifie qu’il n’existe pas d’algorithme 
pour déterminer si une formule est valide ou non valide. Ce résultat fut établi par Alonzo Church et Alan Türing en 
1936 et 1937 [424]. Ils ont aussi montré que cette logique est semi-décidable, c’est-à-dire que nous pouvons écrire un 
programme, qui prend en entrée une formule et qui a le comportement suivant : 


1. S’il termine alors il décide correctement si la formule est valide ou non. Lorsque la formule est valide, la décision 
est généralement accompagnée d’une preuve. 


2. Si la formule est valide, alors il termine. Cependant, l’exécution peut être longue ! 


Notons que si la formule n’est pas valide, la terminaison de ce programme n’est pas garantie. En effet si le programme 
terminait pour toute formule, alors, d’après le premier point, ce serait un algorithme pour déterminer si une formule est 
valide ou non. Or, ainsi qu’il est dit ci-dessus, Church et Türing ont prouvé qu’un tel algorithme n’existait pas. 

Plan : Dans ce chapitre nous commençons par présenter la méthode, introduite par Jacques Herbrand, permettant d’énu- 
mérer un ensemble fini de formules afin de trouver un modèle à une formule. Ensuite nous présentons la transformation 
due à Thoralf Albert Skolem qui transforme (skolémise) une formule en une « forme de Skolem » où l’existence d’un 
modèle est préservée. En transformant ensuite cette forme de Skolem en une « forme clausale » équivalente, nous pou- 
vons appliquer la résolution. Nous reprenons alors le concept de résolution introduit dans le chapitre E page 7/et nous 
l’étudions en logique du premier ordre. En 1929, Kurt Güdel (1906 - 1978) prouva que la logique du premier ordre est 
complète et cohérente. Nous présentons ce résultat pour la résolution, c’est-à-dire qu’il existe une preuve par résolution 
en logique du premier ordre d’une formule F à partir d’un ensemble de formules l si et seulement si F est conséquence 
de T°. 
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5.1 Méthode de Herbrand 


Jacques Herbrand (1908-1931) est un mathématicien et logicien français. Il a établi en 1930 un lien entre calcul des 
prédicats et calcul des propositions. 


5.1.1 Domaine et base de Herbrand 


Nous introduisons d’abord la notion de fermeture universelle qui permet de transformer toute formule en une formule 
fermée où la propriété de satisfiabilité est maintenue. 


Définition 5.1.1 (Fermeture universelle) Soit C une formule ayant pour variables libres x1,...,x,. La fermeture univer- 
selle de C, notée V(C), est la formule Vx; .…..Vx,C. Cette notion est définie à l’ordre près des variables libres de C. Soit T 
un ensemble de formules, V(T) = {V(A)|A er}. 


Exemple 5.1.2 La fermeture universelle de P(x) A R(x, y) est 


Nous généralisons la définition[T.3.1 page 19]aux termes de la logique du premier ordre. 


Définition 5.1.3 (Substitution) Une substitution est une application des variables dans les termes. Soient À une formule 
et 6 une substitution. AG est la formule obtenue en remplaçant toute occurrence libre d’une variable par son image dans 
l'application. La formule AG est une instance de A. 


Dans la suite de ce chapitre, nous ne considérons que des formules qui ne contiennent ni le symbole égal, ni les 
constantes propositionnelles T et L, car leur sens est fixé dans toute interprétation : T vaut 1, L vaut 0, et le symbole 
— est l’identité sur le domaine de l'interprétation (voir Remarque F-3.T8 page 79}. De plus nous considérons que toute 
signature comporte au moins une constante. Ainsi la signature d’un ensemble de formules ne comportant pas de constante, 
sera arbitrairement complétée par la constante a. 


Définition 5.1.4 (Domaine et base de Herbrand) 


1. Le domaine de Herbrand pour E est l’ensemble des termes fermés (i.e., sans variable) de cette signature, dénoté 
par Ds. 


2. La base de Herbrand pour £ est l’ensemble des formules atomiques fermées de cette signature, nous la notons B5. 
Notons que le domaine de Herbrand d’une signature sans constante est vide. Puisque toutes les signatures considérées 
dans ce chapitre doivent comporter au moins une constante, ce domaine n’est pas vide. 


Exemple 5.1.5 Calculs de base de Herbrand : 


1. Soit X la signature comportant uniquement les 2 constantes a, b et les 2 symboles de relations unaires P.Q. Nous 
avons Ds = {a,b} et B; = 


2. Soit X la signature comportant uniquement la constante a, le symbole de fonction unaire f et le symbole de relation 
unaire P. Nous avons D> = {f"(a) |n EN} er Bx — 


5.1.2 Interprétation de Herbrand 


À partir de la base et du domaine de Herbrand d’une formule, nous sommes capables de construire une interprétation 
dite de « Herbrand ». 


Définition 5.1.6 (Interprétation de Herbrand) Soient Z une signature et E € B5. L'interprétation de Herbrand H5£ a 
pour domaine Ds et donne aux symboles le sens suivant : 
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1. Si le symbole s est une constante de la signature, il vaut lui-même dans cette interprétation. 

2. Si s est un symbole de fonction à n > 1 arguments de la signature et si ti,...,t1 € Dx alors (f1,...,fn) = 
S(f1,...,fn). 

3. Si le symbole s est une variable propositionnelle, il vaut 1, autrement dit il est vrai, si et seulement sis € E. 

4. Sis est un symbole de relation de la signature à n > 1 arguments et siti,...,t, € Ds alors SH p = {(f,...,1n) | 


fisc sln E Ds AS(f1,...,) EE}. 


Le résultat suivant montre qu’une interprétation de Herbrand peut être identifiée à l’ensemble des formules atomiques 
fermées dont elle est modèle. 


Propriété 5.1.7 (Propriété d’une interprétation de Herbrand) Soient Z une signature et E C Bs. Dans l'interprétation 
de Herbrand H5 £ : 


1. La valeur d’un terme sans variable est lui-même. 


2. L'interprétation est modèle d’une formule atomique fermée si et seulement si elle est élément de E. 


La preuve est une conséquence directe de la définition d’une interprétation de Herbrand. 

Notons ici, avec un exemple, pourquoi on a supposé que les formules ne contiennent pas les symboles de relation T,L,=, 
dont le sens est fixé dans toutes les interprétations. Supposons au contraire que T soit élément de la base mais non élément 
de E. D’après le point 2, l'interprétation H5,£ donnerait T la valeur O, alors que T vaut 1 dans toute interprétation. 


Exemple 5.1.8 Soit X la signature comportant les 2 constantes a, b et les 2 symboles de relations unaires P, Q. L'ensemble 
E = {P(b),Q(a)} définit l'interprétation de Herbrand Hs £ de domaine Ds = {a,b} 


Théorème 5.1.16 (Fermeture universelle et modèle de Herbrand) Soit Lun ensemble de formules sans quantificateur 


sur la signature Y. La fermeture universelle V(T) a un modèle si et seulement si V(T) a un modèle qui est une interprétation 
de Herbrand de Y. 


Ce théorème est appliqué dans la preuve du théorèmel.2.17 page 100 


5.13 Théorème de Herbrand 


Le théorème de Herbrand établit un lien entre la logique du premier ordre et la logique propositionnelle. 


Théorème 5.1.17 (Théorème de Herbrand) Soit L un ensemble de formules sans quantificateur de signature X. V(T) 
a un modèle si et seulement si tout ensemble fini d’instances fermées sur la signature X des formules de Y a un modèle 
propositionnel application de la base de Herbrand B> dans l’ensemble {0,1}. 


Corollaire 5.1.18 Soit L un ensemble de formules sans quantificateur de signature Y. La fermeture universelle W(T) 
est insatisfaisable si et seulement s’il existe un ensemble fini insatisfaisable d’instances fermées sur la signature Z des 
formules de T. 


Preuve : Le corollaire est obtenu en remplaçant chaque côté de l’équivalence du théorème de Herbrand par sa négation. 


Dans le cas où l'est un ensemble fini de formules, ce corollaire fonde une procédure de semi-décision pour savoir si 
V(T) est ou n’est pas insatisfaisable : nous énumérons l’ensemble des instances fermées des formules de T° sur la signature 
Z et nous arrêtons cette énumération dès que nous obtenons un ensemble insatisfaisable, ou dès que cette énumération est 
terminée sans contradiction ou dès que nous sommes « fatigués » : 


1. Dans le premier cas, la procédure répond (en appliquant le corollaire) que V(T°) est insatisfaisable. 


2. Le deuxième cas ne peut se produire que si le domaine de Herbrand ne comprend que des constantes, la procédure 
répond (en appliquant le corollaire) que V(T°) est satisfaisable et en donne un modèle. 


3. Dans le troisième cas, nous ne pouvons évidemment pas conclure : le corollaire nous dit que si V(T°) est insatisfai- 
sable, et si nous avions été plus courageux, nous aurions obtenu une contradiction. 
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Exemple 5.1.19 


1. Soit T = {P(x),Q(x),-P(a) V -Q(b)}. La signature È comporte 2 constantes a, b et 2 symboles de relation unaire 
P,Q. 


Soit T = {P(x) V Q(x),-P(a),-Q(b)}. Nous avons la même signature que précédemment. 


3. Soit T = {P(x),-P(f(x))}. La signature Y comporte une constante a, un symbole de fonction unaire f et un 


symbole de relation unaire P. La constante a est ajoutée à la signature de T pour que le domaine de Herbrand ne 
soit pas vide. 


Soit T = {P(x) V-P(f(x)),-P(a),P(f(f(a)))}. Nous avons la même signature que précédemment. 


Soit T = {R(x,s(x)),R(x,y) AR(y,2) = R(x,2),-R(x,x)}. La signature 2 comporte une constante a, un symbole 
de fonction unaire s et un symbole de relation binaire R. 
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5.2 Skolémisation 


Le théorème de Herbrand est applicable à la fermeture universelle d’un ensemble de formules sans quantificateur. Nous 
étudions une transformation, la skolémisation, qui change un ensemble de formules fermées en la fermeture universelle 
d’un ensemble de formules sans quantificateur et qui préserve l'existence d’un modèle. Cette transformation est due à 
Thoralf Albert Skolem (1887 - 1963), mathématicien et logicien norvégien. Elle est nécessaire pour pouvoir appliquer la 
résolution sur un ensemble de formules de la logique du premier ordre. Nous commençons par donner l’intuition de la 
skolémisation avant de regarder le résultat de cette transformation sur des exemples simples afin d’observer les propriétés 
de la skolémisation. La skolémisation sert à éliminer les quantificateurs existentiels et change une formule fermée À en 
une formule B telle que : 

— B a pour conséquence À. 

— tout modèle de À donne un modèle de B. 

Par suite À a un modèle si et seulement si B a un modèle : la skolémisation préserve l’existence d’un modèle, nous 
disons aussi qu’elle préserve la satisfaisabilité. Regardons ce qu’il en est sur deux exemples simples. 


Exemple 5.2.1 La formule 2xP(x) est skolémisée en P(a). Nous observons les relations entre ces deux formules : 


1. P(a) a pour conséquence xP(x). 


2. xP(x) n'a pas pour conséquence P(a) mais un modèle de 2x P(x) « donne » un modèle de P(a). En effet soit I un 
modèle de 3xP(x). Donc il existe d € Pr. Soit J l'interprétation telle que P; = Pj et aj = d. J est modèle de P(a). 


Exemple 5.2.2 La formule Vx2yQ(x, y) est skolémisée en VxQ(x, f(x)). Nous observons les relations entre ces deux for- 
mules : 


1. VxQ(x, f(x) 

2. Vx2yQ(x,y) n'a pas pour conséquence VxQ(x, f(x)) mais un modèle de Vx2yQ(x,y) « donne » un modèle de 
VxQ(x, f(x)). En effet soient I un modèle de Vx1yQ(x,y) et D le domaine de I. Pour tout d € D, l’ensemble 
{e€e D|(d,e) € Qr} n'est pas vide, donc il existe g : D — D une fonction[ telle que pour tout dE D, g(d)e {e€ 
D |(d,e) € Q:}. Soit J l'interprétation telle que Qy = Qr et fr = g : J est modèle de VxQ(x, f(x)). 


) a pour conséquence Vx2yQ(x, y). 


5.2.1 Algorithme de skolémisation d’une formule 


Nous définissons d’abord les éléments nécessaires pour présenter la forme de Skolem, ensuite nous donnons un algo- 
rithme de skolémisation. 


Définition 5.2.3 (Formule propre) Une formule fermée est dite propre, s’il elle ne comporte pas de variable liée par 
deux quantificateurs distincts. 


Exemple 5.2.4 Les formules VxP(x) V VxQ(x) et Vx(P(x) = 2xQ(x) A yR(x,y)) ne sont pas propres. 
Les formules VxP(x) V VyQ(y) et Vx(P(x) = 2yR(x,y)) sont propres. 


Nous étendons la notion de forme normale de la logique des propositions à la logique du premier ordre en disant 
qu’une formule est en forme normale si elle est sans équivalence, ni implication, et dont les négations portent uniquement 
sur les formules atomiques. 


Définition 5.2.5 (Forme de Skolem) Soient À une formule fermée et B la formule en forme normale sans quantificateur 
obtenue par la transformation ci-après : B est la forme de Skolem de A. 


Il y a plusieurs façons de skolémiser une formule fermée. Nous proposons un compromis entre l’efficacité et la 
simplicité de la transformation. Notre algorithme est consistué de la succession des quatre étapes suivantes : 


1. Transformation en formule normale : Transformation de la formule fermée en une autre formule fermée en 
forme normale équivalente. 


2. Transformation en formule propre : Transformation de la formule fermée en forme normale en une formule 
fermée, en forme normale, propre et équivalente. 


3. Élimination des quantificateurs existentiels : Cette transformation préserve seulement l'existence de modèle, 
comme nous l’avons vu sur les exemples. 


4. Transformation en forme de Skolem : Transformation de la formule fermée, en forme normale, propre et sans 
quantificateur existentiel en une formule en forme normale sans quantificateur. 


Nous détaillons chacune de ces quatre étapes. 


1. En affirmant l’existence de g, nous utilisons implicitement l’axiome du choix. 
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5.2.1.1 Transformation en formule normale 


Comme dans le cas propositionnel, nous enlevons les équivalences et les implications et déplaçons les négations vers 
les formules atomiques au moyen des équivalences suivantes utilisées de gauche à droite : 

— ÀA&B=(A=B)A(B— A). 

— A—= B=-AVB. 

— A = A. 

— (A AB) = —A V -B. 

— —(AVB) = —A À -B. 

— —VxA = 3x-A. 

— —2xA = Vx-A. 


Remarque 5.2.6 En combinant déplacement de la négation et élimination de l’implication, c’est-à-dire en remplaçant 
—(A = B) par À \ -B, nous pouvons effectuer plus rapidement la transformation en formule normale équivalente, qu’en 
se limitant aux équivalences ci-dessus. 


Exemple 5.2.7 La formule Vy(VxP(x, y) & Q(y)) est transformée par élimination de l'équivalence et de l'implication 
en : 


5.2.1.2 Transformation en formule propre 


En utilisant les résultats sur les changements de variables présentés dans la section [43 page 87] nous changeons le 
nom des variables liées à deux quantificateurs, en choisissant par exemple de nouvelles variables à chaque changement de 
nom. 


Exemple 5.2.8 La formule VxP(x) V VxQ(x) est changée en 


La formule Vx(P(x) = 2xQ(x) A yR(x,y)) est changée en 


5.2.13 Élimination des quantificateurs existentiels 


Soit À une formule fermée normale et propre ayant une occurrence de la sous-formule 2yB. Soient x1,...,x, l’ensemble 
des variables libres de 2yB, où n > 0. Soit f un symbole ne figurant pas dans A. Nous remplaçons cette occurrence de 
2yB par B<y:= f(x, x) >] 


Théorème 5.2.9 Soit A’ la formule obtenue en appliquant l'élimination d'un quantificateur existentiel sur la formule A. 
La formule A’ est une formule fermée en forme normale et propre vérifiant : 


1. A’ a pour conséquence À (A' EX À). 


2. Si A a un modèle alors A a un modèle identique à celui de À sauf pour le sens de f. 


2. Sin =0, f est une constante. 
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Remarque 5.2.10 Dans le théorème |5.2.9 page précédente| il faut constater que la formule A' obtenue à partir de la 


formule À par élimination d’un quantificateur reste fermée, en forme normale et propre. Donc, en « appliquant » plusieurs 
fois le théorème, ce qui implique de choisir un nouveau symbole à chaque quantificateur éliminé, nous transformons une 
formule A fermée, en forme normale et propre en une formule B fermée, en forme normale, propre et sans quantificateur 
existentiel telle que : 

— la formule À est conséquence de la formule B, 

— si À a un modèle, alors B a un modèle identique sauf pour le sens des nouveaux symboles. 


Exemple 5.2.11 En éliminant les quantificateurs existentiels de la formule 2xVyP(x, y) A 2zVu-P(z,u) nous obtenons 


Donc, il faut impérativement utiliser un nouveau symbole lors de chaque élimination d’un quantificateur existentiel. 


Exemple 5.2.12 En éliminant les quantificateurs existentiels de la formule 2xWy=zP(x,y,z) nous obtenons deux solutions 
possibles : 

a VyP(a,y, f(a,y)) 

— VyP(a,y, f(y)) 
Ceci dépend de l’ordre dans lequel nous appliquons l’elimination des quantificateurs existentiels. Or le théorème{S.2.9] 
montre que une des ces transformations a un modèle si et seulement si l’autre a également un modèle. 


5.2.1.4 Transformation en fermeture universelle 


Nous pouvons enfin enlever les quantificateurs universels afin d’obtenir une forme de Skolem. 


Théorème 5.2.13 Soit À une formule fermée, en forme normale, propre et sans quantificateur existentiel. Soit B la formule 
obtenue en enlevant de A tous les quantificateurs universels. La formule A est équivalente à la fermeture universelle de B. 


Preuve : Avec les conditions posées sur À, la transformation de À en V(B) revient à effectuer tous les remplacements 
possibles des sous-formules de la forme suivante : 

— (VxC) AD par Vx(C A D), où x non libre dans D, 

— (VxC) VD par Vx(C V D), où x non libre dans D, 

— DA(VxC) par Vx(D AC), où x non libre dans D, 

— DV (VxC) par Vx(D VC), où x non libre dans D. 
Puisque chacun de ces remplacements change une formule en une autre équivalente, les formules À et V(B) sont équiva- 
lentes. 


5.2.2 Propriétés de la forme de Skolem 


Propriété 5.2.14 Soit À une formule fermée et B la forme de Skolem de A. 
— La formule V(B) a pour conséquence la formule À, 
— si À a un modèle alors V(B) a un modèle. 

Donc À a un modèle si et seulement si V(B) a un modèle. 


Preuve : Soit C la formule fermée en forme normale et propre, obtenue au terme des deux premières étapes de la skolémi- 
sation de À. Soit D le résultat de l’élimination des quantificateurs existentiels appliquée à C. D’après la remarque [5.7.T0] 
nous avons : 

— la formule D a pour conséquence la formule C, 

— siC a un modèle alors D a un modèle. 
Puisque les deux premières étapes changent des formules en des formules équivalentes, À et C sont équivalentes. D’après 
le théorème 5.2. 13] D est équivalent à V(B). Donc nous pouvons remplacer ci-dessus D par V(B) et C par À, ce qui prouve 
le théorème. 


Exemple 5.2.15 Soit A = Vx(P(x) = Q(x)) = (VxP(x) = VxQ(x)). Nous skolémisons —A. 
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1. —A est transformée en la formule en forme normale : 


2. La formule en forme normale est transformée en la formule propre : 


3. Le quantificateur existentiel est « remplacé » par une constante : 


4. Les quantificateurs universels sont enlevés : 


Cette formule est la forme de Skolem de —A suivant la définition[5.7.5 page 97 


Instancions la forme de Skolem de —A en remplaçant x et y par a. Nous obtenons la formule (-P(a)V Q(a))AP(a) A -Q(a) 
qui est insatisfaisable. Donc V((-P(x) V Q(x)) A P(y) A -Q(a)) est insatisfaisable. Puisque, d’après la propriété|5.2.14 
la skolémisation préserve l’existence d’un modèle, —A est insatisfaisable, donc À est valide. 


Pour skolémiser un ensemble de formules, nous skolémisons chaque formule de l’ensemble comme il a été indiqué 
ci-dessus en choisissant impérativement un nouveau symbole pour chaque quantificateur existentiel éliminé durant la 
troisième étape de la skolémisation. Les raisons pour le choix d’un symbole nouveau apparaissent clairement dans la 


preuve du théorème et dans l’exempleS.2.11 page précédente 


Corollaire 5.2.16 En skolémisant un ensemble de clauses fermées T, nous obtenons un ensemble À de formules sans 
quantificateurs tel que : 

— Tout modèle de V(A) est modèle de T. 

— SiT a un modèle alors V(A) en a un modèle qui ne diffère de celui de T que par le sens des nouveaux symboles. 


La skolémisation a des conséquences pratiques : elle facilite la preuve d’insatisfiabilité d’une formule. Elle a aussi des 
conséquences théoriques, que nous examinons. 


Théorème 5.2.17 Soit L'un ensemble dénombrable de formules fermées. Si T a un modèle alors T a un modèle dénom- 
brable. 


Preuve : Nous skolémisons I” en un ensemble A de formules sans quantificateurs. Supposons que T° a un modèle. Alors 


V(A) a un modèle d’après le corollaire |5.2.16| D’après le théorème {S.1.16 page 95] V(A) a un modèle de Herbrand sur 


la signature de A. Puisque l’ensemble T° est dénombrable, sa signature l’est aussi, donc aussi celle de A et par suite le 
domaine de ce modèle de Herbrand est dénombrable. 


Remarque 5.2.18 Appelons théorie, un ensemble de formules. D'après le théorème, toute théorie dénombrable qui a un 
modèle, a un modèle dénombrable. Autrement dit avec une théorie du premier ordre, nous pouvons parler des propriétés 
des nombres réels ou des ensembles, mais nous ne pouvons pas obliger notre théorie à n'avoir que des modèles non 
dénombrables, bien que l’ensemble des réels ou la classe de tous les ensembles ne soient pas dénombrables. 
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5.2.3 Forme clausale 


Après la skolémisation des formules et avant de pouvoir appliquer une généralisation au premier ordre de la méthode 
de résolution il faut transformer les formes de Skolem en clauses comme nous l’avons fait en logique propositionnelle. 
Nous étendons donc les notions essentielles à cette transformation avant de donner les règles permettant cette transforma- 
tion. 


Définition 5.2.19 (Littéral positif, négatif et clause) Un littéral positif est une formule atomique. Un littéral négatif est 
la négation d’une formule atomique. 


Nous remarquons que tout littéral est positif ou négatif, et nous rappelons qu’une clause est une somme de littéraux. 


Définition 5.2.20 (Forme clausale d’une formule) Soit À une formule fermée, la forme clausale de À est un ensemble 
de clauses obtenu en deux étapes : 


1. Skolémisation de À, autrement dire construire B la forme de Skolem de À. 


2. Remplacement de B par un ensemble V équivalent de clauses obtenu par distributivité de la somme sur le produit. 


Propriété 5.2.21 La fermeture universelle de la forme clausale d’une formule fermée a un modèle si et seulement la 
formule a un modèle. Plus précisément : 

— la fermeture universelle de la forme clausale d’une formule a pour conséquence la formule, 

— si la formule a un modèle alors la fermeture universelle de sa forme clausale en a un. 


Preuve : Soient À une formule fermée, B sa forme de Skolem et T° sa forme clausale. D’après les propriétés de la 
skolémisation : 

— V(B) a pour conséquence À. 

— Si A a un modèle alors V(B) a un modèle. 
Puisque l'est obtenu par distributivité, B et L° sont équivalents donc V(B) et V(T”") sont aussi équivalents. Par suite dans les 
deux propriétés ci-dessus, nous pouvons remplacer V(B) par V(T'). 


Définition 5.2.22 (Forme clausale d’un ensemble de formules) Soit L un ensemble de formules fermées. Nous définis- 
sons la forme clausale de T comme l’union des formes clausales de chacune des formules de TV, en prenant soin au cours 
de la skolémisation d'éliminer chaque occurrence d’un quantificateur existentiel à l’aide d’un nouveau symbole. 


Corollaire 5.2.23 Soient Lun ensemble de formules fermées et À la forme clausale de Y. Nous avons : 
— V(A) a pour conséquence T,, et 
— sil a un modèle alors V(A) a un modèle. 


Théorème 5.2.24 (Adaptation du théorème de Herbrand aux formes clausales) Soient T un ensemble de formules fer- 
mées et À la forme clausale de T.. L'ensemble Test insatisfaisable si et seulement s’il existe un sous-ensemble fini insatis- 
faisable d’instances des clauses de À sur la signature de A. 


Preuve : D’après la skolémisation préserve la satisfaisablité, donc : l est insatisfaisable si et seulement si V(A) 
est insatisfaisable. D’après le corollaire du théorème de HerbrandiS.1.18 page 95] V(A) est insatisfaisable si et seulement 
s’il existe un sous-ensemble fini insatisfaisable d’instances des clauses de A sur la signature de A. 


Exemple 5.2.25 Soit À = 2yVz(P(z,y)  —=x(P(z,x) A P(x,2))). Calculons la forme clausale de A. 


1. Mettre À sous forme en forme normale : 


2. Rendre propre le résultat : 
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3. Éliminer les quantificateurs existentiels : 


4. Supprimer les quantificateurs universels, nous obtenons la forme de Skolem de À : 


5. Transformer en produit de sommes de littéraux, nous obtenons la forme clausale de À, qui est l’ensemble suivant 
de clauses : 


D'après la propriété ci-dessus, A n’a pas de modèle si et seulement s’il y a un ensemble fini insatisfaisable d’instances de 
C1,C2,C3 sur la signature de ces clauses. Nous recherchons ces instances : 


5.3 Unification 


Après la mise en forme clausale d’un ensemble de formules en logique du premier ordre et avant de généraliser la 
résolution pour ces clauses, nous avons besoin d’un algorithme résolvant l’égalité entre deux termes. Étant donné deux 
termes, trouver une substitution qui appliquée à ces deux termes les rendent égaux est appelé problème d’unification de ces 
deux termes. Ce problème a intéressé de grands noms de l’informatique comme Alan Robinson [23], Gérard Huet [TSI[T6], 
Alberto Martelli et Ugo Montanari 1], ou encore plus récemment Franz Baader et Ayne Snyder [A]. 


5.3.1 Unificateur 


Définition 5.3.1 (Expression, solution) Appelons expression, un terme ou un littéral. Une substitution 6 (voir défini- 


tion E.T.T page 94) est solution de l’équation e1 = e2 entre deux expressions, si les deux expressions e16 et e26 sont 
identiques. Une substitution est solution d’un ensemble d'équations si elle est solution de chaque équation de l’ensemble. 


Définition 5.3.2 (Unificateur) Soient © une substitution et E un ensemble d'expressions. EG = {16 |t € E}. La substi- 
tution G est un unificateur de E si et seulement si l’ensemble EG n'a qu'un élément. Soit {ei|l < i < n} un ensemble 
fini d'expressions. La substitution 6 est un unificateur de cet ensemble si et seulement si elle est solution du système 
d'équations {e; = e;;1|l <i<n}. 


Définition 5.3.3 (Support d’une substitution) Le support d’une substitution © est l’ensemble des variables x telles que 
x £ x. Dans la suite, nous nous intéressons seulement aux substitutions à support fini, c'est à dire qui ne changent 
qu'un nombre fini de variables. Une substitution 6 à support fini est notée < x1 :=t1,...,Xn :=t, > ou plus simplement 
X1:=t1,...,Xn := 1, quand il n’y a pas de risque d’ambiguïté. Les variables x1,...,x, sont distinctes et la substitution 
vérifie : 
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— Pour i de 1 à n, x;6 =ti. 
— Pour toute variable y telle que y & {x1,...,Xn}, nous avons : yG = y. 


Exemple 5.3.4 L'équation P(x, f(y)) = P(g(z),z) a pour solution : 


Le système d'équations x = g(z), f(y) = z a pour solution : 


Définition 5.3.5 (Composition de substitutions) Soient 6 et t deux substitutions, nous notons Gt la substitution telle 
que pour toute variable x, xot = (xo)t. La substitution OT est une instance de ©. Deux substitutions sont équivalentes si 
chacune d'elles est une instance de l’autre. 


Exemple 5.3.6 Considérons les substitutions suivantes : 
G1=<X:=g(z),y'=2>. 
O2 =<x:=g(y),z:=7y >. 
03 =<x:=g(a),y:=a,z:=a >. 

Nous avons les relations suivantes entre ces substitutions : 


Définition 5.3.7 (Solution la plus générale) Une solution d’un système d'équations est appelée la plus générale (en fran- 
çais nous disons aussi principale) si toute autre solution en est une instance. Notons que deux solutions « les plus géné- 
rales » sont équivalentes. 


Exemple 5.3.8 L’équation f(x,g(z)) = f(g(y),x) a pour solutions (entre autres) : 


Définition 5.3.9 (Unificateur le plus général) Soit E un ensemble d'expressions. Nous rappelons qu'une expression est 


un terme ou un littéral. Un unificateur de E (voir définition|5.5.2 page précédente) est appelé le plus général (ou encore 


principal), si tout autre unificateur en est une instance. 


Remarque 5.3.10 (Unificateur le plus général et solution la plus générale) Soit E — {e;|1 <i<n} un ensemble d'ex- 
pressions. Dans la définition d’un unificateur, nous avons indiqué que 6 est un unificateur de E si et seulement si 6 est 
solution du système S = {e; =e;;,|1 <i<n}. 

Donc l’unificateur le plus général de E est la solution la plus générale de S. 


5.3.2 Algorithme d’unification 


L’algorithme calculant la solution d’un système d’équations est appelé algorithme d’unification car la recherche d’un 
unificateur d’un ensemble d’expressions se réduit à la recherche d’une solution d’un système d’équations. L’algorithme 
sépare les équations en équations à résoudre, notées par une égalité et équations résolues, notées par le signe :=. Initiale- 
ment, il n’y a pas d’équations résolues. L’algorithme applique les règles énoncées ci-dessous. Il s’arrête quand il n’y a plus 
d'équations à résoudre ou quand il a déclaré que le système à résoudre n’a pas de solution. Quand il s’arrête sans avoir 
déclaré l’absence de solution, la liste des équations résolues est la solution la plus générale du système initial d'équations. 


104/129 Chapitre 5. Base de la démonstration automatique 


5.3.2.1 Les règles de l’algorithme 


Notre algorithme d’unification consiste à appliquer les six règles suivantes : 


1. 
2. 


Supprimer. Si les deux membres d’une équation sont identiques, l’équation est suppriméef] 


Décomposer. Si les 2 membres d’une équation sont distincts et commencent par le même symbole alors : 

— Une équation de la forme —A — -B est remplacée par À — B. 

— Une équation de la forme f(51,...,54) = f(f1,...,1) est remplacée par les équations s1 —f1,...,51 — 1. Pour 
n = 0, cette décomposition supprime l’équation. 


. Échec de la décomposition. Si une équation à résoudre est de la forme f(s1,...,51) = g(f1,...,f) avec f # g 


ou ñn £ p alors l’algorithme déclare qu’il n’y a pas de solution. En particulier il y a évidemment un échec si nous 
cherchons à résoudre une équation entre un littéral positif et un littéral négatif ou bien si nous avons une constante 
et une fonction. 


. Orienter. Si une équation est de la forme f = x où t est un terme qui n’est pas une variable et x une variable, alors 


nous remplaçons l’équation par x =f. 


. Elimination d’une variable : Si une équation à résoudre est de la forme x = f où x est une variable et f un terme 


ne contenant pas x alors : 
(a) Enlever des équations à résoudre x —t. 
(b) Remplacer x par f dans toutes les équations (non résolues et résolues) 


(c) Ajouter x :=f à la partie résolue. 


. Echec de l'élimination : Si une équation à résoudre est de la forme x = f où x est une variable et f un terme distinct 


de x et contenant x alors l’algorithme déclare qu’il n’y a pas de solution. 


Exemple 5.3.11 Nous appliquons cet algorithme afin de résoudre les équations suivantes : 


1. 


2. 


3. 


f(x, 8()) = f(g(y),x). 


f(x,x,a) = f(e(y),g(a),y). 


f(,x,x) = f(g(y),8(a),y). 


3. Nous pouvons nous limiter à la suppression des équations de la forme x = x où x est une variable. 
4. Un algorithme efficace évite ce remplacement systématique. 
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Nous montrons d’abord que notre algorithme est correct, c’est-à-dire qu’il calcule bien un unificateur. Ensuite nous 
démontrons qu’il termine toujours. 


5.3.2.2 Correction de l’algorithme 


Nous observons facilement les trois faits suivants : 

— (1) : les règles de suppression, de décomposition, d'orientation et d’élimination des variables préservent l’ensemble 
des solutions. 

— (2) : initialement et après toute application de règle, l’ensemble des équations résolues forme une substitution 
X1:=t1,...,Xn = fn OÙ X1,...,X) SOnt des variables distinctes ne figurant pas dans les termes #1,...,f,. Soit 6 cette 
substitution. Il est clair que f;6 = f; ainsi 6 est solution des équations résolues. 

— (3) : Les règles d’échec déclarent correctement l’absence de solution. 

De (1) et (2), il résulte que si l’algorithme termine sans échec, la substitution © trouvée est la solution la plus générale 

du système initial. En effet : 

— 6 est une solution, puisque, d’après (2), elle est solution du système terminal et que, d’après (1), l’ensemble des 
solutions est préservé par les règles. 

— 6 est une solution la plus générale, puisque, d’après (1), toute autre solution est une solution du système terminal, 
donc une instance de la substitution définie par ce système. 

De (1) et de (3), il résulte que si l’algorithme déclare un échec, alors le système initial n’a pas de solution. En effet, 

dans ce cas : 

— si le système initial avait une solution, d’après (1), elle serait solution du système terminal, 

— d’après (3), le système terminal n’a pas de solution. 


5.3.2.3 Terminaison de l’algorithme 


— Les règles de suppression et de décomposition font décroître strictement la somme des longueurs des termes qui 
sont de part et d’autre des équations. 

— La règle d'orientation fait décroître strictement la somme des longueurs des termes qui sont à gauche des équations. 

— La règle d'élimination fait décroître strictement le nombre de variables des équations non résolues. 

Il résulte que l’algorithme d’unification termine. 


5.4 Résolution au premier ordre 


Nous avons maintenant tous les ingrédients pour présenter la résolution au premier ordre. Bien entendu nous transfor- 
mons un ensemble de formules en forme clausale. Ensuite nous pouvons appliquer trois règles permettant de « factoriser » 
des termes, de « copier » une clause et enfin de faire une « résolution binaire ». Ces différentes règles utilisent l’algorithme 
d’unification présenté précédemment. Par la suite, nous montrons la cohérence et la complétude de ce système formel. La 
complétude est basée sur le théorème de Herbrand dans la version donnée dans le corollaire [5.7.34 page 101] 


54.1 Trois règles pour la résolution 


Soit un ensemble de clauses, nous supposons que V(T') n’a pas de modèle, nous proposons alors un système formel 
permettant de déduire L de [avec les trois règles suivantes : 
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1. La factorisation qui de la prémisse P(x, f(y)) V P(g(),2) V Q(z,x) déduit P(g(f(>)), 09) V Q(FO),8(f 0). 
La clause déduite est obtenue en calculant la solution la plus générale x := g(f(y)),z := f(y) de P(x, f(y)) = 


P(&(2);2). 
2. La règle de copie qui permet de renommer les variables d’une clause. 


3. La résolution binaire (RB) qui des deux prémisses sans variable commune P(x,a) V Q(x) et -P(b,y) VR(f(y>)) 
déduit le résolvant Q(b) V R(f(a)), en calculant la solution plus générale x := b,y := a de P(x,a) = P(b,y). 


Pour simplifier la présentation des règles, nous identifierons une clause, qui est une somme de littéraux, avec l’ensemble 
de ses littéraux. Nous formalisons ces trois règles. 
5.4.1.1 Factorisation 


Propriété 5.4.1 Soient À une formule sans quantificateur et B une instance de A. Nous avons : V(A) :- V(B). 


Définition 5.4.2 La clause C' est un facteur de la clause C si C' = C ou s’il existe un sous-ensemble E de C tel que E a 
au moins deux éléments, E est unifiable et C' = Co où © est l’unificateur le plus général de E. 


Exemple 5.4.3 La clause P(x) V Q(g(x,y)) V P(f(a)) a deux facteurs : 


Nous obtenons immédiatement la propriété suivante. 


Propriété 5.4.4 (Cohérence de la règle de factorisation) Soit C’ un facteur de la clause C. Nous avons : V(C) E V(C'). 


Preuve : Puisque C’est une instance de C, la propriété est une conséquence immédiate de la propriété [5.4.1] 


5.4.12 Copie d’une clause 


Définition 5.4.5 Soient C une clause et G une substitution, qui ne change que les variables de C et dont la restriction aux 
variables de C est une bijection entre ces variables et celles de la clause Co. La clause CG est une copie de la clause C. 
La substitution 6 est aussi appelée un renommage de C. 


Définition 5.4.6 Soient C une clause et G un renommage de C. Soit f la restriction de 6 aux variables de C et f-! 
l'application réciproque de f. Soit Ge! la substitution ainsi définie pour toute variable x : 
— Si x est une variable de C6 alors 300 = xf7! (par soucis de clarté, nous avons préféré utiliser la notation 
postfixée xf| plutôt que la notation préfixée f(x), plus usuelle). 
— Sinon 20 =X. 
Cette substitution est appelée l'inverse du renommage © de C. 


Exemple 5.4.7 Soit 6 =<x:=u,y:= v>. 6 est un renommage du littéral P(x, y). Le littéral P(u, v), où P(u,v) = P(x,y)o, 
est une copie de P(x, y). Soit t=<u:=x,v:=7y>. test l'inverse du renommage © de P(x, y). Notons que P(u,v}t = P(x, y) : 
le littéral P(x, y) est une copie de P(u,v) par le renommage t. 


Propriété 5.4.8 Soient C une clause et © un renommage de C. 
I. (PS est un renommage de CG. 
2. Pour toute expression ou clause E, dont les variables sont celles de C, Eo6, =E,. 
Donc Coce! = C'et par suite C est une copie de Co. 
Preuve : Soit f la restriction de 6 aux variables de C. Par définition du renommage, f est une bijection entre les variables 


de C et celles de Co. 


1. Par définition de 6 l, cette substitution ne change que les variables de Co et sa restriction aux variables de Co est 
la bijection f-—!. Donc, 6: est un renommage de CG. 
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2. Soit x une variable de C. Par définition de f, x664 l=x ff! = x. Donc, par une récurrence omise et sans intérêt 
sur les termes, littéraux et clauses, pour toute expression ou clause E, dont les variables sont celles de C, nous 
avons Eo6,! =E. 


Propriété 5.4.9 Soient deux clauses copies l’une de l’autre, leurs fermetures universelles sont équivalentes. 


Preuve : Soit C’ une copie de C. Par définition, C’ est une instance de C et par la propriété précédente, C est une copie de 


C’, donc une instance de C”. Donc par la propriété {5.4.1 page ci-contre) la fermeture universelle de C est conséquence de 
celle de C’ et inversement. Par suite, ces deux fermetures universelles sont équivalentes. 


5.4.1.3 Résolution binaire 


Définition 5.4.10 Soient C et D deux clauses n’ayant pas de variable commune. La clause E est un résolvant binaire 
de Cet D s’il y a un littéral LE C et un littéral M € D tels que L et M° (le littéral opposé à M) sont unifiables et si 
E ={((C—{L})U(D —-{M}))6 où 6 est la solution la plus générale de l'équation L = M°. 


Exemple 5.4.11 Soient C = P(x,y) V P(y,k(z)) et D = -P(a,f(a,yi)). 


Propriété 5.4.12 (Cohérence de la règle de résolution binaire) Soit E un résolvant binaire des clauses C et D, nous 
avons : V(C),V(D)  V(E). 


Preuve : Soit / une interprétation. Puisque les trois formules V(C),V(D),V(E) sont sans variable libre, il suffit de montrer 
que si est modèle de V(C) et de V(D) alors Z est modèle de V(E). Supposons que 1 est modèle de V(C),V(D) et montrons 
que c’est un modèle de V(E). Soit e un état quelconque de cette interprétation. (1,e) est modèle de Co et Do, pour toute 
substitution G. Par définition du résolvant binaire, il y a un littéral L € C et un littéral M € D tels que Let M° (le littéral 
opposé à M) sont unifiables. Ainsi, LO et Mo sont deux littéraux opposés, donc (7,e) est modèle soit de l’un, soit de 
l’autre de ces deux littéraux. 


1. Supposons (/,e) modèle de Lo. Puisque (1,e) est contre-modèle de Mo et modèle de Do, c’est un modèle de 
(D — {M})6 donc de E car (D—{M})6CE. 


2. Supposons (J,e) contre-modèle de Lo. Puisque c’est un modèle de Co, c’est un modèle de (C — {L})o donc de E 
car (C—{L})oCE. 


Donc (1,e) est modèle de E. Puisque l’état e est quelconque, 7 est modèle de V(E). 


5.4.1.4 Preuve par factorisation, copie et résolution binaire 


Définition 5.4.13 Soient Lun ensemble de clauses et C une clause. Une preuve de C à partir de TV est une suite de clauses 
se terminant par C, toute clause de la preuve étant un élément de TV, un facteur d’une clause la précédant dans la preuve, 
une copie d’une clause la précédant dans la preuve ou un résolvant binaire de deux clauses la précédant dans la preuve. 


C'est déduite de [au premier ordre par les 3 règles de factorisation, copie et résolution binaire est dénoté par l'E: rer C. 
Cela signifie qu’il y a une preuve de C à partir de I”. Quand il n’y a pas d’ambiguïté sur le système formel utilisé, nous 
remplaçons F1fc par F. 

5.4.2 Cohérence de la résolution 


Propriété 5.4.14 (Cohérence) Soient T un ensemble de clauses et C une clause. SiT Hi$ep C alors V(T) = V(C). 


Preuve : Cette propriété est une conséquence immédiate de la cohérence de la factorisation, de la copie et de la résolution 


binaire. Cette preuve est demandée dans l’exercice[07 page 114] 
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Exemple 5.4.15 Soient les deux clauses : 
1. Ci = P(x,y) V P(,x). 
2. Ci =-P(u,z) V-P(z,u). 


Montrons par résolution que V(C1,C2) n'a pas de modèle. 


Cet exemple montre, a contrario, que la résolution binaire seule est incomplète, sans la factorisation, nous ne pouvons 
pas déduire la clause vide. 


Exemple 5.4.16 Soient les trois clauses : 
1. Ci =-P(z,a)V -P(z,x) V -P(x,z2). 
2. Ci = P(z, f(z)) VP(z,a). 
3. C3 = P(f(z),z) V P(z,a). 


Nous donnons une preuve par résolution que V(C1,C2,C3) n'a pas de modèle. Dans cette preuve RB 1(3), 3(1) signifie 
par résolution binaire sur le 3° littéral de la clause I et le 1° littéral de la clause 3. 


5.4.3 Complétude de la résolution 


Nous définissons une nouvelle règle, la résolution au 1° ordre, qui est une combinaison des trois règles de factorisation, 
copie et résolution binaire. Ceci nous permettra de prouver la complétude de la résolution. 
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Définition 5.4.17 La clause E est un résolvant au 1° ordre des clauses C'et D si E est un résolvant binaire de C' et D'où 
C' est un facteur de C et D’ est une copie sans variable commune avec C' d’un facteur de D. La règle qui de C et D déduit 
E est appelée la résolution de 1° ordre. 


Exemple 5.4.18 Soient C — —P(z,a) V —P(z,x) V -P(x,z) et D = P(z, f(2)) V P(z,a). 
C' = -P(a,a) est un facteur de C. La clause P(a, f(a)) est un résolvant binaire de C' et de D (qui est facteur de 
lui-même) donc 


Soient I un ensemble de clauses et C une clause, nous avons défini jusqu’à présent trois notions de preuve par 
résolution que nous distinguons en notant par : 


1. TF,C le fait qu’il y existe une preuve de C à partir de L° obtenue par résolution propositionnelle, autrement dit 
sans substitution. 


2. T'Hifep C le fait qu’il y existe une preuve de C à partir de L° par factorisation, copie et résolution binaire. 


3. TH, C le fait qu’il y existe une preuve de C à partir de [obtenue par résolution de 1° ordre. 


Puisque la résolution du premier ordre est une combinaison des règles factorisation, copie et résolution binaire, nous 
avons immédiatement l'H1, C implique L'Hirep C. 


Théorème 5.4.19 (Théorème du relèvement) Soient C et D deux clauses. Soient C' une instance de C et D' une instance 
de D. Soit E' un résolvant propositionnel de C’ et D, il existe E un résolvant au premier ordre de C et D qui a pour 
instance E". 


Exemple 5.4.20 Soient C = P(x) V P(y) VR(y) et D = -Q(x) V P(x) V -R(x) V P(y). 
— Les clauses C' = P(a)V R(a) et D' = -Q(a)V P(a)V -R(a) sont des instances respectivement de C et D. 
— La clause E! = P(a) V -Q(a) est un résolvant propositionnel de C' et D’. 
— La clause E = P(x) V -Q(x) est un résolvant au 1° ordre de C et D qui a pour instance E. 


Théorème 5.4.21 Soient T un ensemble de clauses et À un ensemble d’instances des clauses de T,, et C1,...,Cn une 
preuve par résolution propositionnelle à partir de À, il existe une preuve D\,...,D, par résolution au 1° ordre à partir de 
l'felle que pour i de 1 à n, la clause C; est une instance de D. 


Preuve : Nous effectuons une récurrence sur n. Soit C1,...,Cn,Cn+1 une preuve par résolution propositionnelle à partir 
de A. Par récurrence, il existe une preuve D;,...,D, par résolution 1° ordre à partir l' telle que pour à de 1 à n, la clause 
Ci est une instance de D;. Nous distinguons deux cas : 
1. Supposons C,:1 € À. Il existe E € T dont C,., est une instance donc nous prenons D,1:1 =E. 
2. Supposons que C;,1 soit un résolvant propositionnel de C; et C4 où j,k < n. D’après le résultat précédent, il existe 
E résolvant au 1° ordre de D; et D} : nous prenons D, ,1 = E. 


Nous en déduisons immédiatement le corollaire suivant. 


Corollaire 5.4.22 Soient lun ensemble de clauses et À un ensemble d’instances des clauses de T°. Supposons que AF, C. 
Il existe D telle que Y'H1, D et C est une instance de D. 


Exemple 5.4.23 Soit l’ensemble de clauses P(f(x)) V P(u),-P(x) V Q(z),-Q(x) V -Q(y). La fermeture universelle de 
cet ensemble de clauses est insatisfaisable et nous le montrons de trois manières. 
1. Par instanciation sur le domaine de Herbrand { f"(a),n € N} : 
— P(f(x)) V P(u) est instanciée par x := a,u := f(a) en P(f(a)) 
— —P(x) V Q(z) est instanciée par x := f(a),z:= a en -P(f(a)) V Q(a) 
— —Q(x) V -Q(y) est instanciée par x := a,y := a en -Q(a) 
L'ensemble de ces 3 instanciations est insatisfaisable, comme le montre la preuve par résolution propositionnelle 


ci-dessous : 
P(f(a)) —P(f(a)) VQ(a) 
Q(a) 7Q(a) 
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2. Cette preuve par résolution propositionnelle est relevée en une preuve par la règle de résolution au premier ordre : 


P(FG))VP(U) —P(Gx)VQ() 
Q(2) rQ() V 00) 
all 


3. Chaque règle de résolution au premier ordre est décomposée en factorisation, copie et résolution binaire : 


PGI VPOD pu POV Cie 
PU) POVOG) 7 UV 00) 
0) _ 20 


Théorème 5.4.24 (Complétude réfutationnelle de la résolution au 1° ordre) Soit L un ensemble de clauses. Les pro- 
positions suivantes sont équivalentes : 


Ti 
2. THige L 
3. YTD)EL 


Preuve : 

— Nous savons que (1) implique (2), car la résolution au 1° ordre est une combinaison de factorisation, copie et 
résolution binaire. 

— Nous savons que (2) implique (3), car la factorisation, la copie et la résolution binaire sont cohérentes. 

— Il nous reste à montrer que (3) implique (1). Supposons que V(T) H L, autrement dit V(T°) est insatisfaisable. 
D’après le théorème de Herbrand, il y a À un ensemble fini d’instances sans variable de clauses de T qui n’a 
pas de modèle propositionnel. Par complétude de la résolution propositionnelle, nous avons : AF, L. D’après le 
corollaire au relèvement il existe D telle que l'H1, D et L est instance de D. Dans ce cas, 
nous avons D = JL. 


5.5 Outil logiciel 


Nous indiquons ici un logiciel pour expérimenter le système de déduction décrit dans ce chapitre : 


Cet outil, de façon similaire à celui proposé pour la déduction naturelle propositionnelle au paragraphe [3.3 page 66] 
permet de saisir une liste de clauses du premier ordre. Il tente alors automatiquement d’en déduire la clause vide : 
— si cette liste de clauses est insatisfaisable et qu’aucune limite de temps ni de taille n’a été fixée, alors la clause vide 
sera déduite ; 
— il est possible de restreindre l’espace de recherche, en imposant une limite de temps ou de taille sur les clauses 
produites (mais alors on perd la complétude du prouveur). 
Si la liste de clauses est insatisfaisable, on obtient une preuve utilisant les règles de copie, factorisation et résolution 
binaire, annotée par les unificateurs utilisés. 
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5.6 Exercices 


Exercice 80 (Domaine de Herbrand) Soient X la signature composée de la constante a et des symboles de fonctions f 
et g respectivement à un et deux arguments. 

— Donner éléments différents du domaine de Herbrand de cette signature. 

— Définir inductivement ce domaine. 


Exercice 81 (Signature, domaine et base de Herbrand) Pour chacun de ces ensembles de formules : 
— = {P(x) VQ(x) VR(x),-P(a),-Q(b),-R(c)}. 
— P = {P(x),-0(x),-P(F(x)) V O(F(x))}. 
— P3 = {P(x), (f(x), RFF (x))), PCF CF (x))) V =Q(x) VR(F(x)) + 


1. Donner la signature, le domaine de Herbrand ainsi que la base de Herbrand. 


2. Prouver si leur fermeture universelle a un modèle ou pas. 


Exercice 82 (Méthode de Herbrand) Utiliser la méthode de Herbrand pour démontrer que l’ensemble de formules sui- 
vant est insatisfaisable : 


1. VxR(x, f(x)) 

. VaVy(S(x, y) VR(x, y) VR(y,x)) 
. VxVy(S(x,y) V -R(x,y)) 

. VaVy(S(x,y) V =R(,x)) 

. Vy=S(y, a) 
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Exercice 83 (Méthode de Herbrand.*) Utiliser la méthode de Herbrand pour démontrer que l’ensemble de formules 
suivant est insatisfaisable : 


1. Vx(Q(x) V =P(F(x))) 

2. Vy(Q0) = R()) 

3. Vz(-P(z) = Q(z) VR(:)) 
4. Vu-R(u) 


En particulier, vous devez transformer votre ensemble d’instances insatisfaisable en un ensemble de clauses équivalent. 
Puis, vous devez démontrer la contradiction via une preuve par résolution propositionnelle à partir de ce dernier en- 
semble. 


Exercice 84 (Méthode de Herbrand,*) Soit T l’ensemble de formules suivant : 
1. —S(x,y) V-M(Z,x) V MZ, y) 
2. S(x,y)VM(F(x,y);x) 
. Sy) V=M(f(y),7) 
. S(c,a) 
. S(a,b) 
. $(c,b) 
Déterminer un ensemble fini insatisfaisable d’instances fermées de ces formules. 
On peut en déduire quelque chose à propos d’un ensemble de formules du 1*'ordre : lequel et que peut-on conclure ? 


3 
4 
5] 
6 


Exercice 85 (Modèle de Herbrand,***) Soit A l’ensemble de formules suivant : 
L'OX<YAY<IZX<Z. 
2. (x < x). 
3. x<y—æx< f(x,y)Af(x,y) <y. 
4 a <b. 
— Indiquer un modèle de V(A). 
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— V(A) a-t-il un modèle sur le domaine de Herbrand engendré par a,b, f ? 


Exercice 86 (Skolémisation et forme clausale) Skolémiser les formules suivantes (attention aux négations!) puis les 
mettre en forme clausale. 


1. —(2xP(x) V xQ(x) = 2x (P(x) V O(x))). 

(Va yVz(e(x, y) Ae(y,z) = —e(x,z)) = —2xVy e(x, y)). 
(= VxP(x) V -VxQ(x) = -(VxP(x) AVxQ(x))). 
Va((AyP(x, y) = 2xQ(x)) A TyP(x, y) A 2x0 (x)). 
V5Vz((P(y) = 9(z)) = (P() = Q(x)))). 


TS 
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A 


TS 
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Exercice 87 (Unification) Les termes suivants sont-ils unifiables ? Si la réponse est oui, donner leur unificateur le plus 
général, sinon justifier la réponse négative. 

Te h(g(x), f(a,y),2) et h(,z, f(u,x)). 

Te h(g(x), f(a,y),2) et h(y,z, f(u,g(x))). 


Exercice 88 (Unification) Donner les unificateurs les plus généraux des termes suivants s’ils existent : 


1. R(a, f()) = R,f(80:b))), 

2. RO, F0) = RG, f(80,b))), 

3. O(y, f(a), f(x) = Q(g(a,b),x, f(y)), e 

4. Q6,.f(x),86:x)) = QG, f0),8( (a " 


Exercice 89 (Unification) Donner les unificateurs les plus généraux des termes suivants s’ils existent : 
1. pair(a,crypt(z,b)) et pair(x, y). 
. pair(crypt(x,b),crypt(y,b)) et pair(crypt(a,b),z). 


. crypt(pair(z,a),x) et crypt(pair(y,crypt(x,b)),b). 
. crypt(pair(a,z),x) et crypt(pair(y,crypt(x,b)),b). 
. f(x,y,g(a,a) 
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) et f(g(y,y),2,2) 
. f(x, y,a) et f(y,8(2,2),x) 


Exercice 90 (Unification avec plusieurs solutions) L’équation f(g(y),y) — f(u,z) a deux solutions « les plus géné- 
rales »(rappel : elles sont donc équivalentes). Indiquer ces deux solutions. 


Exercice 91 (Forme clausale et instanciation,*) Montrer que la formule suivante est valide en mettant sa négation sous 
la forme clausale et en trouvant un ensemble contradictoire d’instances des clauses obtenues : 


Vx(P(x) = Q(x)) = (VxP(x) = VxQ(x)). 


Exercice 92 (Forme clausale et preuve par résolution,**) Considérons les formules suivantes : 
1. Hi = =2xP(x) = VxP(x). 
2. Hi =Vx(P(x) VQ(x)). 
3. C=2x-Q(x) = VxP(x). 


Nous voulons montrer que C est conséquence de H\ et H; par instanciation et par résolution. 


1. Mettre en forme clausale l’ensemble des trois formules Hi, H, —C. 


2. Trouver des instances contradictoires des clauses obtenues et montrer par résolution propositionnelle que ces 
instances sont contradictoires. 
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3. Donner une preuve directe de cette contradiction par factorisation, copie et résolution binaire. Il est possible que 
seule la dernière règle soit utilisée. 


Exercice 93 (Preuve par résolution, **) 
— En utilisant une preuve par factorisation, copie et résolvant binaire prouver que la fermeture universelle de l’en- 


semble de clauses suivant est insatisfaisable : 
1. P(F(x)) V -Q(a). 
Q(a,a) V R(x,x,b) V S(a,b). 
S(a,z) V -R(x,x,b). 
—P(f(c)) VR(x,a,b). 
—S(y,z) V -S(a,b). 
— En utilisant une preuve par factorisation, copie et résolvant binaire prouver que la fermeture universelle de l’en- 
semble de clauses suivant est insatisfaisable : 


1. P(x). 
2. =P(y)VO (x). 
3. —Q(xa)V=Q(b,y) V -Q(b,a)V =P(f(y)). 
— En utilisant une preuve par factorisation, copie et résolvant binaire prouver que la fermeture universelle de l’en- 
semble de clauses suivant est insatisfaisable : 


1. R(x,a). 

R(,b). 

R(z,a +b). 

—(b<x+b)V(a+b<a). 

b<z. 

—(a+b <x)V-R(y,b). 

Rappel : /e symbole + est plus prioritaire que le symbole <, qui est lui-même plus prioritaire que les connecteurs 


logiques binaires. 
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Exercice 94 (Unification, résolution) Soient L', = {P(x,f(x,b),u),-P(g(a),z,h(z))} l’ensemble des deux clauses uni- 
taires et V2 l’ensemble des deux clauses unitaires {P(x, f(x,b),u),-P(g(z),z,h(2))}. Les ensembles V(T 1) et V(T2) sont- 
ils satisfaisables ou insatisfaisables ? 


Exercice 95 (Skolémisation et preuve par résolution) Le but de cet exercice est de démontrer le syllogisme suivant : 
Vx(homme(x) = mortel(x)) À homme(Socrate) = mortel(Socrate) 


— Skolémiser la négation du syllogisme. 

— Transformer la forme de Skolem obtenue en forme clausale. 

— Démontrer par instanciation que la négation du syllogisme est une contradiction. 

— Démontrer en utilisant une preuve par factorisation, copie et résolution binaire que la négation du syllogisme est 
une contradiction. 


Exercice 96 (Forme clausale et preuve par résolution,**) Considérons les formules suivantes : 
1. Ai = ZuVv(P(u) A (R(v) = Q(u,v))). 
2. A2 = VuVvy(-P(u) V -S(v) V -Qu,v)). 
3. A3 = 2v(R(v)AS(v)). 


Montrer que la liste de ces trois formules est contradictoire par résolution : 


< 


1. Mettre en forme clausale les trois formules A;, As, A3. 
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2. Trouver des instances contradictoires des clauses obtenues et montrer cette contradiction par résolution proposi- 
tionnelle. 


3. Faire une preuve directe de L par factorisation, copie et résolution binaire. 


Exercice 97 (Cohérence de la résolution au premier ordre) Prouver la cohérence de la résolution au premier ordre, 
c'est-à-dire : 


Soit I un ensemble de clauses et C une clause. SiT Hirep C alors V(T) Æ V(C). 


Exercice 98 (Forme clausale et preuve par résolution,**) Considérons les formules suivantes : 
1. EE =Vx(x = x). 
2. E = VxVy(x=y=y=x). 
3. E3 = VxVyVzVt(x=yAz=t=(xez=yet)) 
4 C=VyVz(p=z= Vr(reyexez)). 


E\,E2,E3 sont des axiomes de l'égalité : E1 exprime que l'égalité est réflexive, E2 qu’elle est symétrique, E3 que c’est 
une congruence relativement à l'appartenance. La transitivité de l’égalité ne sert pas dans cet exercice. C exprime que 
deux ensembles égaux ont les mêmes éléments. Nous notons que dans cet exercice, le symbole égal est traité comme un 
symbole de prédicat « ordinaire » dont le sens n’est pas fixé comme étant l'identité, mais que nous « définissons » par ses 
propriétés. Autrement dit l'interdiction de l’égalité dans les formules, c’est en réalité l'interdiction de l'égalité comme 
symbole de sens fixé. Montrer que C est conséquence des axiomes de l'égalité. 


1. Mettre en forme clausale les trois formules E1, Ex, E3, -C. 
2. Trouver des instances contradictoires des clauses obtenues. 


3. Faire une preuve directe de L par factorisation, copie et résolution binaire. 


Exercice 99 (Forme clausale et preuve par résolution,**) Considérons les formules suivantes : 
1. Hi = Vu(2vR(u,v) = R(u, f(u))). 
2. Hi = Vu2vR(u,v). 
3. H3 = uR(f(f(u)),u). 
4. C=udv2w(R(u,v) AR(v,w) AR(w,u)). 
Montrer que C est conséquence de H;,H2,H3. 


1. Mettre en forme clausale les trois formules Hi, H;, H3, -C. 


2. Trouver des instances contradictoires des clauses obtenues (montrez la contradiction par résolution proposition- 
nelle). 


3. Faire une preuve directe de cette contradiction par factorisation, copie et résolution binaire. 


Exercice 100 (Forme clausale et preuve par résolution,**) Soit P(x,y) une formalisation de « x est père de y ». Soit 
A(x, y) une formalisation de « x est aïeul de y ». Soient les trois formules : 


1. Hi = VxZyP(x, y). 
2. Hi = VxVyVz(P(x,y) A P(y,z) = A(x,2)). 
3. C=VxlyA(x, y). 
Montrons que C est conséquence de H;,H;, de la façon suivante, transformer Hi,H;,-C en leur forme clausale, puis 


trouver des instances contradictoires des clauses obtenues (montrez la contradiction par résolution propositionnelle). 
Enfin, dériver la clause vide par factorisation, copie, résolution binaire. 


Exercice 101 (Formule de Bernays-Schonfinkel,***) Une formule BS (de Bernays-Schonfinkel) est une formule fermée, 
sans symbole de fonction, de la forme 2x1...=x,Vy1...Vy, B où B est sans quantificateur. Expliquer pourquoi nous 
pouvons décider la satisfaisabilité d’une telle formule. 


Chapitre 6 


Déduction naturelle au premier ordre : 
quantificateurs, copie et égalité 
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É N plus des règles du chapitre El nous ajoutons les règles concernant les quantificateurs, la copie et l’égalité. Notre 

système comporte toujours une seule règle pour enlever les hypothèses (la règle d'introduction de l’implication). 
Les définitions de brouillon de preuve, environnement, contexte, formule utilisable restent inchangées. Nous montrons 
la cohérence des règles de notre système, mais nous admettons sans preuve, que ce système est complet : des preuves 
de complétude pour des systèmes de règles similaires peuvent être trouvées dans les livres 2] [I]. Contrairement au 
cas propositionnel, il n’y a aucun algorithme pour décider si une formule est valide ou non valide (preuve donnée par 
Alonzo Church et Alan Türing en 1936 et 1937 [A [24]). Autrement dit, en admettant l’équivalence entre prouvable (sans 
environnement) et valide, il n’y a pas d’algorithme qui, étant donné une formule, puisse nous en construire la preuve, ou 
nous avertir que cette formule n’a pas de preuve. 


Plan : Nous étendons d’abord les règles de la déduction naturelle proposées pour la logique propositionnelle. Nous 
présentons ensuite deux nouvelles tactiques pour aider à la rédaction de preuves. Enfin, nous prouvons la cohérence de 
notre système. 


6.1 Règles pour la logique du premier ordre 


Notre système de règles se divise en plusieurs familles de règles : 

— les règles « propositionnelles », 

— les règles d’introduction et d'élimination de quantificateur, 

— les règles régissant l’égalité, 

— et une règle de copie. 
L'ensemble des règles définies dans la section [3 page 57] peuvent être utilisées dans notre système de déduction. Nous 
renvoyons le lecteur à la table[3.T page 59] qui récapitule l’ensemble de ces règles. Dans la suite de cette section, nous 
présentons uniquement les règles de déduction naturelle dédiées à la logique du premier ordre. 
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6.1.1 Règles des quantificateurs 


L'ensemble des règles d’introduction et d’élimination de quantificateur est présenté dans la table[6.1] Dans cette table, 
A et B sont des formules, x est une variable, { est un terme. Notez que contrairement aux règles « propositionnelles », 
l’usage de ces nouvelles règles est contraint par des conditions d’emploi, qui utilisent les notions de variable libre (Défi- 
nitionFF.7.3 page 77} et de terme libre pour une variable (Définition K.3.34 page 82}. 

Dans la suite, nous détaillons ces règles et nous illustrons leur usage sur des exemples et des contre-exemples montrant 
les erreurs occasionnées par le non respect des conditions d’emploi. 


Règles Conditions d’emploi 
VxA 
A<Xx:=1> ve 


A 
VA 1 


JxA (A=B) 


TABLE 6.1 — Règles d’introduction et d’élimination des quantificateurs. 


6.1.1.1 Règles pour le quantificateur universel 


La règle d'élimination du quantificateur universel, notée VE, signifie que si la formule À est vraie pour toute valeur de 
x alors toute instance de A où x est remplacé par un terme t libre pour x est vraie. Notez que cette règle est une simple 


application du corollaire [.3.38] page[S3] 


VxA 


A<x:=t> VE 


Nous justifions ci-dessous les conditions d’emploi de cette règle par un exemple montrant qu’un usage incorrect de la 
règle peut conduire à prouver une formule non-valide. 


Exemple 6.1.1 Nous montrons qu'un usage incorrect de la règle VE conduit à « prouver » une formule non valide. 


contexte | numéro | ligne règle 

1 1 Supposons VxAyP(x, y) 

1 2 yP(5,y) VE 1, y ERREUR 
3 Donc VxdyP(x,y) = 2yP(y,y) | = 11,2 


À la ligne 2, nous n'avons pas respecté les conditions d'applications de la règle VE car le terme y n’est pas libre 
pour x dans la formule 2yP(x,y). Nous donnons une interprétation qui est un contre-modèle de la « conclusion » : soit I 
l'interprétation de domaine {0,1} avec P; = 


La règle d'introduction du quantificateur universel, notée VI, signifie que si nous avons pu déduire la formule A 
indépendemment de la valeur de x, nous pouvons généraliser en déduisant VxA. Ainsi, il est nécessaire que x ne soit libre 
ni dans l’environnement de la preuve, ni dans le contexte de la ligne où nous avons déduit À. 


A 
A 
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Nous illustrons maintenant l’emploi de la règle d'introduction du quantificateur universel avec un exemple d'usage 
correct (exemple[6.1.2} et un exemple d'usage incorrect (exemple6.T.3} de la règle. 


Exemple 6.1.2 Nous prouvons VyP(y) A VyQ(y) = Vx(P(x) A Q(x)). 


contexte | numéro | ligne règle 
1 1 Supposons VyP(y) AVyQO(y) 

1 2 

1 3 

1 4 

1 po] 

1 6 

1 7 

8 Donc VxP(x) À VxQ(x) = Vx(P(x) AQ(x)) | 11,7 


Exemple 6.1.3 Nous montrons qu'un usage incorrect de la règle VI conduit à « prouver » une formule non valide. 


contexte | numéro | ligne règle 

1 1 Supposons P(x) 

1 2 VxP(x) VI 1 ERREUR 
3 Donc P(x) = VxP(x) | = 11,2 


À la ligne 2, nous n’avons pas respecté les conditions d'applications de la règle VI car la prémisse P(x) est établie 
dans le contexte P(x), ce qui interdit de généraliser sur x. Nous donnons un contre-modèle de la « conclusion » : 


6.1.12 Règles pour le quantificateur existentiel 


La règle d’élimination du quantificateur existentiel, notée 2E, signifie que si xA est vraie et que nous pouvons déduire 
À = B indépendemment de la valeur de x, alors nous pouvons déduire B, si la formule B ne dépend, elle non plus, de la 
valeur de x. Aïnsi, il est nécessaire que x ne soit libre ni dans l’environnement de la preuve, ni dans B, et ni dans le 
contexte de la ligne À = B. 


JxA (4 =8B) 
B 


La condition d’emploi de cette règle étant complexe, nous illustrons l’emploi de la règle avec deux exemples d’usage 
incorrect. 


Exemple 6.1.4 Nous montrons qu'un usage incorrect de la règle 23E conduit à « prouver » une formule non valide. 


contexte | numéro | ligne règle 

1 1 Supposons AxP(x) A (P(x) = VyQ(y)) 

1 2 ZxP(x) AEI 1 

1 3 P(x) = VyQ(y) AE2 1 

1 4 O0 2E 2,3 ERREUR 
5 Donc xP(x) A (P(x) = VyQ(y)) = VyQ(y) | = 11,4 


118/129 Chapitre 6. Déduction naturelle au premier ordre : quantificateurs, copie et égalité 


Nous n'avons pas respecté la condition que le contexte de la prémisse P(x) = VyQ(y) ne doit pas dépendre de x. Il est 
clair que la conclusion obtenue n’est pas valide. Nous donnons une assignation (1,e) qui est un contre-modèle de cette 
« conclusion » : 


Exemple 6.1.5 Nous montrons qu'un usage incorrect de la règle 23E conduit à « prouver » une formule non valide. 


contexte | numéro | ligne règle 
1 1 Supposons xP(x) 
1,2 2 Supposons P(x) 
1 3 Donc P(x) = P(x) = 12,2 
1 4 P(x) 2E 1,3 ERREUR 
1 5 VxP(x) VI 4 
6 Donc xP(x) = Vx P(x) | 11,5 


La conclusion de la règle 2E est P(x), contrairement à la condition d'application de cette règle qui impose que la 
conclusion ne doit pas dépendre de x. Nous donnons une interprétation qui est un contre-modèle de la cette « conclu- 
sion » : 


La règle d’introduction du quantificateur existentiel, notée 27, signifie que si une instance de la formule À où x est 
remplacé par un terme t libre pour x est vraie, alors la formule 2xA est vraie. Notez que cette règle est une simple 
application du corollaire F.3.38] page [83] Ce qui justifie la condition d’emploi. Pour s’en convaincre, il suffit d'étudier 
l’exemple[Æ.3.37 qui précède le corollaireFE.3.38] 

Ci-dessous, nous donnons un exemple d’usage correct de la règle d'introduction du quantificateur existentiel en dé- 
montrant l’une des lois de De Morgan. 


Exemple 6.1.6 (Lois de De Morgan) Nous montrons que pour toute formule À, —-VxA = 2x-A. 


contexte | numéro | ligne règle 
1 1 Supposons —VxA 

1, 2 

1, 3 

1, 4 

1, Si 

1, 6 

1, 7 

1, 8 

1, 9 

1 10 

1 11 

12 Donc —VxA = =x-A 1 1,11 
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6.1.2 Copie 


La règle de copie consiste à déduire d’une formule À, une autre formule 4’ égale au changement près des variables 
liées, au sens de la définition [4.4.3] page[S8] Par exemple, Vx1yP(x, y) est une copie de Vy=xP(y, x). 


L Copie 
Notez qu’il n’y pas de condition d’emploi pour cette règle. 


6.1.3 Les règles de l’égalité 


Deux règles caractérisent l’égalité : un terme est égal à lui-même (règle de la réflexivité) et si deux termes sont égaux, 
nous pouvons les remplacer l’un par l’autre (règle de la congruence). 


f=f Réf lexivité 
s=t A<x:=Ss> 
Congruence 
A<x:=t> 


Nous remarquons que la première règle n’a pas de prémisse. C’est ce que nous appelons aussi un axiome. Nous 
remarquons aussi que les conditions d’emploi de la deuxième règle sont similaires à celles des règles VE et 2]. Ces 
conditions d'emploi se justifient de la même manière que précédemment. 

Nous donnons maintenant deux exemples d’application des règles d’égalités. 


Exemple 6.1.7 Prouvons que s =t =t —s, autrement dit prouvons que l'égalité est symétrique. 


contexte | numéro | ligne règle 
1 1 Supposons s =f 
1 2 
1 3 
4 Doncs={—t—s 


Exemple 6.1.8 Prouvons que s =t At =u—=s =u, autrement dit prouvons que l’égalité est transitive. 


Supposons Ss—={/Aft—=u 


MER EME 


CRE NRC ENIE 


Doncs—=f/Af=u—s—=u 


6.2 Tactiques de preuves 


Nous instroduisons deux nouvelles tactiques pour l’application des règles V7 et 3E et nous illustrons ces tactiques 
avec un exemple. 
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6.2.1 Raisonner en avant avec une hypothèse d’existence 


Soient L'un ensemble de formules, x une variable, À et C des formules. Supposons que nous cherchons une preuve de 


C dans l’environnement [',=xA. 


1. Supposons que x n’est libre ni dans [”, ni dans C. Dans ce cas, la preuve peut toujours s’écrire : 


Supposons À 


preuve de C dans l’environnement T,A 


DoncA=&C —=11, 


C 2E 


2. Supposons que x soit libre dans I” ou C. Nous choisissons une variable y « nouvelle », c’est-à-dire non libre dans 
F, Cet absente de À, puis nous nous ramenons au cas précédent, via la règle de copie. La preuve s’écrit alors : 


Supposons A<x:=7y> 


TyA<x := y> Copie de 2xA 


preuve de C dans l’environnement [,A<x:= y> 


Donc A<x:=y>= C = 


C 2E 


I 1,_ 


La recherche de la preuve initiale a été réduite à la recherche d’une preuve dans un environnement plus simple. C’est 
exactement le mode de raisonnement appliqué dans les cours de mathématiques quand nous cherchons une preuve d’une 
formule C avec l’hypothèse xP(x). Nous introduisons une constante « nouvelle » a vérifiant P(a) et nous prouvons C 


sous l’hypothèse P(a). 


6.2.2 Raisonner en arrière pour généraliser 


Nous reprenons les notations du paragraphe précédent. Supposons que nous cherchons une preuve de VxA dans l’en- 


vironnement ]. 


1. Supposons que x n’est pas libre dans 1. Dans ce cas, la preuve peut toujours s’écrire : 


preuve de À dans l’environnement l 


VxA VI 


2. Supposons que x est libre dans T°. Nous choiïsissons une variable y « nouvelle », c’est-à-dire non libre dans l’, puis 
nous nous ramenons au cas précédent, via la règle de copie. La preuve s’écrit alors : 


preuve de A<Xx := y> dans l’environnement T° 


VyA<x:=y> VI 


VxA Copie de la formule précédente 


La recherche de la preuve initiale a été réduite à la recherche d’une preuve d’une formule plus simple dans le même 
environnement. C’est exactement le mode de raisonnement appliqué dans les cours de mathématiques quand nous cher- 
chons une preuve de VxP(x). Nous introduisons une constante « nouvelle » a et nous prouvons P(a). Puis nous ajoutons : 


puisque le choix de a est arbitraire, nous avons VxP(x). 


6.2.3 Un exemple d’application des tactiques 


Nous notons « il existe un et un seul x » par d!x. Formellement, 2!xP(x) si 


séparant l’existence de x et son unicité, nous pouvons aussi définir = 


IxP(x) par 2 


gnifie x(P(x) A Vy(P(y) = x = y)). En 
XxP(x) A VxVy(P(x) A P(y) = x = y). Ces 


deux définitions sont bien sûr équivalentes et nous montrons formellement que la première implique la deuxième. Comme 


la preuve est longue, il faut apprendre à décomposer les preuves. 


6.2. Tactiques de preuves 121/129 


Plan de la preuve Nous appliquons les deux tactiques suivantes : 
— Pour prouver À = B, supposer À et déduire B 
— Pour prouver À A B, prouver À et prouver B. 


1 Supposons x{(P(x)AVy(P(y) = x = y)) 
preuve de 2xP(x) dans l’environnement de (1) 


preuve de VxVy(P(x) A P(y) = x = y) dans l’environnement de (1) 
AxP(x) A VaVy(P(x) À P(y) = x = y) N 
Donc Ax(P(x) AVy(P(y) = x = y)) = 2xP(x) A Va y (PT) AP(y)=x=7y) =1 


Application de la tactique utilisant une hypothèse d’existence 
Nous cherchons une preuve de xP(x) dans l’environnement de 2x(P{x) A Vy(P(y) = x = y)). Nous appliquons la 
tactique « raisonner en avant en présence d’une hypothèse existentielle ». 


référence formule 


i 2x(P(x) AVy(PO) = x = })) 

1 Supposons P(x) AVy(P(y) = x = y) 

2 P(x) EI 1 
3 ZxP(x) 412, x 
4 Donc P(x)AVy(P(y) =x=7y)==xP(x) —=11,2 
5 ZxP(x) ZE i, 3 


Application de la tactique pour obtenir une conclusion générale 

Nous cherchons une preuve de VxWy(P(x) A P(y) = x = y) dans l’environnement de 2x(P(x) A Vy(P(y) = x = y)). 
Nous appliquons, dans l’ordre ci-dessous, les tactiques suivantes : 

— «raisonner en avant en utilisant d’une hypothèse existentielle ». 

— Pour prouver À = B, supposer À et déduire B 

— «raisonner en arrière pour obtenir une conclusion générale ». 


environnement 


référence formule 
i (PQ) AWPO) + += 5) 
contexte | numéro | preuve règle 
Supposons P(x) A Vy(P(y) = x = y) 


OI Ia un R © D|I- 


ml 
m|© 


= 
D 


= 
S 


CN ES D D 


== 
RS 


= 
un 


(e} 
5 
< 
= 
E 
> 
2 
Œ 
Y 
= 
Œ 
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La tactique « utiliser une hypothèse d’existence » sert à produire la ligne 16. La tactique « introduire une implication » 
sert à produire la ligne 15 : elle introduit l'hypothèse (1) dans laquelle x est une variable libre. Donc, pour appliquer la 
tactique « obtenir une conclusion générale », il faut changer de variable dès la ligne 2. Observer aussi que la formule, ligne 
3, est instanciée aux lignes 5 et 8. 

Comme sur cet exemple, toute la difficulté des preuves est concentrée autour des règles VJ et 2E : 

— dans le raisonnement en avant, il faut trouver les bonnes instanciations des formules commençant par un quantifi- 

cateur existentiel. 

— dans le raisonnement en arrière, il faut trouver la bonne instance permettant de déduire une formule commençant 

par un quantificateur universel. 


6.3 Cohérence du système 


Nous commençons par montrer deux propriétés à propos des quantificateurs existensiel et universel. Enfin nous mon- 
trons la cohérence de notre système de déduction. 


Propriété 6.3.1 Soient L'un ensemble de formules, x une variable et À une formule. Supposons que x ne soit pas libre 
dans Y,, alors nous avons : T + À si et seulement si TV + YxA. 


Preuve : 


Si nous observons d’un œil critique cette preuve, nous observons que c’est une paraphrase, dans un autre formalisme, 
de la loi VZ. C’est l’équivalence ci-dessus, qui explique que la tactique « raisonner en arrière pour généraliser », est une 
tactique utilisable sans risque. En effet, en admettant la complétude du système, lorsque x n’est pas libre dans F”, il y a une 
preuve de À dans l’environnement [si et seulement s’il a une preuve de VxA dans ce même environnement. 


Propriété 6.3.2 Soient Lun ensemble de formules, x une variable, À et B deux formules. Supposons que x ne soit libre ni 
dans T,, ni dans B, alors nous avons : T = À = B si et seulement siT = (xA) = B 


Preuve : 

— Supposons que LH À = B. Soit (J,e) une assignation modèle de I. Puisque x n’est pas libre dans |, pour tout 
état f identique à e sauf pour la valeur de x, (1, f) et (1,e) donnent la même valeur aux formules de 1, donc (1, f) 
est modèle de T°. Puisque L = À = B, pour tout état f identique à e sauf pour la valeur de x, (7, f) est modèle de 
A = B. Supposons que (J,e) est modèle de 2x4, il existe g identique à e sauf pour la valeur de x tel que (7,g) est 
modèle de À. Puisque pour tout état f identique à e sauf pour la valeur de x, (7, f) est modèle de À = B, alors (J,g) 
est modèle de B. Puisque x n’est pas libre dans B, (1,e) est modèle de B. 


< Supposons que L = (xA) — B. Puisque la formule À = (2xA) est valide (d’après le corollaireÏ.3.38 page 83), 
nous avons l'E À = B. 


Si nous observons d’un œil critique cette preuve, nous voyons que c’est une paraphrase, dans un autre formalisme, de la 
loi 2E. C’est l’équivalence ci-dessus, qui explique que la tactique « raisonner en avant avec une hypothèse d’existence », 
est une tactique utilisable sans risque. En effet, en admettant la complétude du système, lorsque x n’est libre ni dans }, 
ni dans B, il y a une preuve de B dans l’environnement l°,A si et seulement s’il a une preuve de B dans l’environnement 
F,=xA. 


Théorème 6.3.3 (Cohérence de la déduction) Si une formule est déduite d’un environnement de formules alors elle en 
est une conséquence. 
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Preuve : La preuve obéit au même plan que celle du même théorème dans le cas propositionnel (voir théorème B31 
et nous en reprenons les notations en traitant uniquement le cas des nouvelles règles. 

Soit lun ensemble de formules. Soit P une preuve de À dans cet environnement. Soient C; la conclusion et H; le 
contexte de la i-ème ligne de la preuve P. Rappelons que les lignes d’une preuve sont numérotées à partir de 1 et que A6 
est la liste vide. 

Notons par I”, H; l’ensemble des formules de l’ensemble T'et de la liste H,;. 


Cas de base : Supposons que À est déduite de I” par la preuve vide. Alors À est élément de I”, donc [° = A. Puisque 
Hh est la liste vide, nous pouvons conclure : l,H6 À. 


Induction : Supposons que pour toute ligne i < k, [',H; = Ci. Montrons que L”, A4 E Cx. 


Nous examinons uniquement le cas des nouvelles règles et pour simplifier nous ne faisons pas de distinctions entre 

deux formules égales aux abréviations près de la négation et de l’équivalence. 

— Supposons que C4 = VxA et que cette ligne ait été déduite, par la règle VJ, de la formule À avec À = C; et 
O<i<kouAET.SiA=C;et0 <i< Kk, par hypothèse de récurrence nous avons, l',H; HA. Si A € T'alors 
TA. Puisque Ho est la liste vide, il existe i où 0 < i < k tel que L',H; — A. Vu les conditions d’application 
de la règle, x n’est pas libre dans ”,H;. Donc, d’après la propriété [6.3.T page ci-contre] nous avons aussi 
L°,H; = VxA. Puisque la ligne i est utilisable sur la ligne k — 1 et que H est la liste vide, H; est préfixe de Hy-1. 
Puisque le contexte n’est pas modifié par la ligne k, nous avons H5_1 = H4, donc 1°, Hy E C4. 

— Supposons que C; = A<x:=1> et que cette ligne ait été déduite, par la règle VE, de la formule VxA avec 
VxA = C; et 0 < i < k ou VxA € [°. Par hypothèse de récurrence ou parce que Ho est la liste vide, il existe à 
où 0 <i< k tel que L,H; = VxA. D’après les conditions d’application de la règle, le terme f est libre pour 
la variable x dans la formule A. Donc, d’après le corollaire la formule VxA = A<x:=1> est 
valide et par suite l,H; = A<Xx :=1t>. Puisque la ligne i est utilisable sur la ligne k — 1, et que Ho est la liste 
vide, H; est préfixe de H4-_,. Puisque le contexte n’est pas modifié par la ligne k, nous avons H}_1 = H}, donc 
L,H4E C. 

— Supposons que C; = =xA et que cette ligne ait été déduite, par la règle 27, de la formule À <x := 1> avec 
A<x:=t> = Cet0 <i<kou A<x:=1>E€T. Par hypothèse de récurrence ou parce H, est la liste vide, 
il existe à où 0 < i < Kk tel que l,Hj H A<x:=1>. D’après les conditions d’applications de la règle, le 
terme t est libre pour la variable x dans la formule A. Donc, d’après le corollaire .3.38 page 83] la formule 
A<x:=1>— 2xA est valide et par suite L',H;  2xA. Puisque la ligne i est utilisable sur la ligne k — 1, et que 
Ho est la liste vide, H; est préfixe de H;_;1. Puisque le contexte n’est pas modifié par la ligne Kk, nous avons 
Hz-: . H}, donc V,Hk FF Ck. 

— Supposons que C4 = B et que cette formule ait été déduite, par la règle 2E, de la formule 2xA avec 2xA = C; 
et0 <i<kou xA € let de la formule À = B avec À = B=C;et0 < j <kou À = B ET. Par hypothèse 
de récurrence ou parce H, est la liste vide, il existe i et j tels que 0 <i<k,0<j<k,T,H; = =xA et 
l,H; FH A = B. Vu les conditions d’application de la règle, x n’est libre ni dans l°,H;, ni dans B. Donc, 
d’après la propriété[6.3.2 page précédente] nous avons aussi l,H; = (1xA) = B. Puisque les lignes i et j sont 
utilisables sur la ligne & — 1, et que A est la liste vide, H; et H; sont préfixes de H;_1. Puisque le contexte 
n’est pas modifié par la ligne k, nous avons Hy_1 — Hy, donc L,H4 = =xA et L',Hyx E (AxA) = B. Par suite 
V,Ht E Cx. 

— Supposons que C4 — A’ et que cette formule ait été déduite, par la règle de copie de la formule À avec À —C; 
et O0 <i<kou A ET". Par hypothèse de récurrence ou parce H, est la liste vide, il existe à tel que O0 < i <K, 
l',H; = À. Puisque, d’après le théorème les formules À et 4’ sont équivalentes, nous avons 
T,H; H A’. Puisque la ligne i est utilisable sur la ligne k — 1, et que Ho est la liste vide, H; est préfixe de Hy_1. 
Puisque le contexte n’est pas modifié par la ligne k, nous avons H£_1 = H4, donc ,H4 E C4. 

— Supposons que C4 = (1 —t). Puisque cette formule est valide (dans le sens attribué à l’égalité), l, Hy = C4. 

— Supposons que C; = A<x:=t> et que cette ligne ait été déduite, par la règle de congruence, de la formule 
s=t avec (s=t) =C;et0 <i<kou (s =t) € let de la formule A<x := s5> avec A<x:=s5>=C;et0 < j<k 
ou A<Xx :=s>E€ I". Par hypothèse de récurrence ou parce H, est la liste vide, il existe à et j tels que 0 < i <K, 
O<j<Rk.T,HEÈ(s=t)etT,H;HA<x:=s>. Puisque les lignes i et j sont utilisables sur la ligne k— 1, 
et que AH, est la liste vide, H; et H; sont préfixes de H;_,. Puisque le contexte n’est pas modifié par la ligne &, 
nous avons Hy_1 = Hy, doncT,H4; = (s=t)etl,Hx = A<Xx:=5s>. D’après le théorème f.3.36 page 83]et les 
conditions d’application de la règle, nous avons : s =f,A<x:=s>HA<x:=1>. Par suite l,Hy = Cy. 


LES 


Puisque la dernère ligne d’une preuve a un contexte vide, nous obtenons que sa conclusion est conséquence de T°. 
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6.4 Exercices 


Exercice 102 (Déductions naturelles) Prouver en déduction naturelle du premier ordre les formules suivantes : 


1. le fameux syllogisme, « Tout homme est mortel, Socrate est un homme, donc est mortel », que nous formalisons 
par Vx(H(x) = M(x)) AH(socrate) = M(socrate). 


2. VxP(x) = 2yP(y). 
3. VxP(x) = =xP(x). 
4. Vx(P(x) A Q(x)) = VxP(x 

5. A(P()VO()) + 

6. Vx(P(x) = Q(x)) A xP(x) = xQ (x). 
7. ) 
6. 

9. 


ZxP(x) V xQ(x) = 2x(P(x) V O(x)). 
Vx(P(x) = Q(x)) A Vx(Q(x) = R(x)) = Vx(P(x) = R(x)). 
Vx (P(x) = Q(x)) A 2x -Q(x) = 2x -P(x). 


Dans cet exercice, les formules P(x) et Q(x) peuvent être remplacées par des formules quelconques. 


Exercice 103 (Déductions naturelles) Prouver les formules suivantes : 


1. VxWyP(x,y) = VyVxP(x, y). 


2. HxyP(x,y) = Ty2xP(x, y). 


3. xVyP(x,y) = Vy=xP(x, y). 
4. Vx(Q (x) = Vy(RG) = P(x,y))) = Vy(RO) = Vx(Q(x) = P(x,y))). (#) 


Dans cet exercice, la formule P(x, y) peut être remplacée par une formule quelconque. Par contre Q(x) peut être remplacée 
seulement par une formule n'ayant pas y comme variable libre, et R(y) peut être remplacée par une formule n'ayant pas 
x comme variable libre : expliquez la raison de ces contraintes. 


Exercice 104 (Chercher la faute) Considérons la formule suivante : 


dx P(x) AVx Q(x) = 2x (P(x) A Q(x)). 


Parmi les trois preuves suivantes une seule est correcte par déduction naturelle. Identifier la preuve correcte et justifier 
pourquoi les deux autres ne le sont pas. 


1. 

contexte | numéro | preuve règle 

1 1 Supposons dx P(x) AVx Q(x) 

1 2 2x P(x) AEI 1 

1 3 Vx Q(x) AE2 1 

1,4 4 Supposons P(x) 

1,4 5 Q(x) VE 3, x 

1,4 6 P(x) AQ(x) NA45 

1,4 7 Zx(P(x) A Q(x)) 31 6, x 

1 8 Donc P(x) = =x{(P(x) A Q(x)) = 14,7 

1 9 Zx(P(x) A O(x)) 1E 2,8 
10 Donc 2x P(x) A Vx Q(x) = =x(P(x) A Q(x)) | = 71,9 
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contexte | numéro | preuve règle 

1 1 Supposons 2x P(x) AVx Q(x) 

1 2 2x P(x) AEI 1 

1 3 Vx Q(x) AE2 1 

1,4 4 Supposons P(x) 

1,4 5 Q(x) VE 3, x 

14 6 P(x) AQ() NA45 

1 7 Donc P(x) = P(x) AQ(x) = 14,6 

1 8 P(x)AQ(x) 3E 2,7 

1 9 Zx(P(x) A Q(x)) 1 8, x 
10 Donc 2x P(x) A Vx Q(x) = =x(P(x) AQ(x)) | = 71,9 

d 

contexte | numéro | preuve règle 

1 1 Supposons dx P(x) AVx Q(x) 

1 2 2x P(x) AEI 1 

1 3 Vx Q(x) AE2 1 

1,4 4 Supposons P(x) 

1 5 Donc P(x) = P(x) = 1 4,4 

1 6 PQ) JE 2,5 

1 7 Q(x) VE 3, x 

1 8 P(x)AQ(x) A 6,7 

1 9 Zx(P(x) A Q(x)) I 8, x 
10 Donc 2x P(x) A Vx Q(x) = =x(P(x) AQ(x)) | = 71,9 


Exercice 105 (Copie) Prouver par déduction naturelle que VxWyP(x,y) = VxWyP(y, x) en utilisant la règle de copie un 
minimum de fois. 


Exercice 106 (Déduction naturelle) Prouver les formules suivantes grâce à la déduction naturelle (notez que Q est une 
variable propositionnelle) : 


1. Vx(QAP(x)) = QAVxP(x) 

. QAVxP(x) = Vx(Q A P(x)). 

. Vx(Q V P(x)) = Q VVxP(x). (**) 

. QVVxP(x) = Vx(Q V P(x)). 
) 
) 
) 
) 


Zx(Q A P(x)) = QA=xP 

QA=XP(x) = x(Q A P(x)). 

Zx(Q V P(x)) = QV=xP(x 
8. QV=xP(x) = 2x(Q V P(x)). (*) 

Dans cet exercice, la formule P(x) peut être remplacée par une formule quelconque. Par contre, Q peut être remplacée 

seulement par une formule n'ayant pas x comme variable libre. 


N D À % D 
Z 
= 


Exercice 107 (Preuve) Prouver la formule —=2xP(x) = Vx-P(x). Vérifier que P(x) peut être remplacée par une formule 
quelconque. Remarque : cette formule est la réciproque de la formule prouvée à l ’exemple[6.T.6 page TT] 


Exercice 108 (Égalité) Prouver les formules suivantes : 
1. R(a,c) (a =b) = R(b,c). 
2. x=y= f(x2) = (2). 
3. VxZy(x = y). 
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4. xVy x = y = VxVy x = y. (*) 


Exercice 109 (Égalité,**) Prouver que la deuxième définition de « il existe un et un seul x » (voir sous-section [6.2.3 
page 120) implique la première, autrement dit prouver la formule : 2xP(x) À VxVy(P(x) À P(y) = x = y) = x(P(x) A 
VyPO) x = y). 


Exercice 110 (Induction et déduction naturelle, ***) Nous pouvons définir l'addition grâce aux deux formules : 

(a) Vn(n+0=n). 

(b) Wnp(n+s(p) =s{n+ p}) 
Ces deux formules permettent de faire des additions : nous pouvons grâce à elles prouver que s(0) +s(0) = s(s(0)). Mais 
elles ne permettent pas de prouver les propriétés générales de l'addition, qui nécessitent d’avoir le principe de récurrence. 


1. Montrer que des hypothèses (a) et (b), nous ne pouvons pas déduire Vn(0 + n = n). 

2. Nous donnons un nom à la propriété ci-dessus et nous posons le principe de récurrence sur cette propriété : 
(c) Vn(P(n) & 0+n=n). 
(d) P(0) A Vn(P(n) = P(s(n))) = VnP(n). 
Prouver par la déduction naturelle que (a) A (b) A(c) A (d) = YnP(n). 


Exercice 111 (Examen 2009) Les preuves demandées ci-dessous devront être justifiées. 


1. Donner une preuve en déduction naturelle avec les justifications de la validité de la formule : 
x px) = Vx qQ)) = Vx(p(x) = q()). 
2. Donner une preuve en déduction naturelle avec les justifications de la validité de la formule : 
x pQ) AV) = PF) = x PQ). 
3. Notons f"(x) le terme obtenu en appliquant n fois f à x. 
Par exemple f(x) = x, f(x) = f@),f20) = F0) 
Soient T',A deux ensembles de formules et A,B deux formules. On rappelle que T'H À est vrai s’il y a une preuve 
de À dans l’environnement T°. 
On donne ci-dessous des propriétés triviales de la relation +. 
Monotonie : silT'+HAetl'C A alors AH A. 
Composition : ST+HAetT+HA=B8B alors THB. 


TS 


(a) Donnez une preuve en déduction naturelle avec les justifications de ce que la propriété suivante est vraie : 
Vx(p(x) = p(f (x) F xp(f (x) = 2x PPT (x) 
(b) Déduire de la propriété ci-dessus, de la monotonie et de la composition que pour tout entier naturel n : 


x px), Vx(p) = PO) + 3x p(f" (a). 


Exercice 112 (Examen 2012) Prouver les formules suivantes par déduction naturelle au premier ordre. 
1. Val) V 306) = —(VxP(x) A0 0). 
2. VxVy(P(y) = R(x)) = ZyP(y) = VxR(x). 
3. —Vx=P(x) = xP(x). 


Exercice 113 (Examen 2013) Prouver les formules suivantes par déduction naturelle au premier ordre. 
1. 2x(Q(x) = P(x)) A VxQ(x) = xP(x). 
2. Vx Vy(R(x, y) = =R(y,x)) = Vx=R(x,x). 


Exercice 114 (Quelques questions posées en examen) Démontrer les formules suivantes par déduction naturelle. 
1. 2x (P(x) V Q(x)) A Vx-Q(x) = 2xP(x). 
2. Vx(P(x) = Q(x)) A x(P(x) AR(x)) = x(Q(x) A R(x)). 
3. x (P(x) V -P(x)) = VxP(x). 
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clause unitaire, [6] formule atomique sur une signature, [70] 
complet, [B4] formule décomposable, 
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conflit, [PU] formule propre, [P7| 


conjonction, G formule satisfaisable, [T7] 


connecteur, formule stricte, [T2] 

nn formule sur une signature, [70] 

consistant, formule utilisable, [61] 
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contexte, [60 
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Exercises for Chapter I.1 


Exercise 1 (Strict Formulas, Prioritized Formulas) 
Which of the following expressions are strict formulas? 


1. x 


OT OPEN POSE 
j 
TRS 
8 
< 
& 
= 


= 
(æ) 
ui 
a 
< 
= 
> 
a? 
Ÿ 
e 
Ÿ 
= 


Exercise 2 ( Formulas and Priority) 
Prove that every (strict) formula is a prioritized formula. 


Exercise 3 (Formulas and Priority) 
Consider the following tree representation of the formula ((p A -(p V q)) A -r). 


IN 
VAN — 
P 7 r 
V 
P q 
Using priority, this formula can be written with fewer parentheses: pA-(pVq)A-r using logical 
notation, p p +q T using boolean notation. Similarly, give the tree representation, logical 


notation and boolean notation, both using as few parentheses as possible of the following 
formulas: 


1. (-(a Ab) & (a V -b)). 

(-a V b) A (-b V a)). 

((a Ab) A c) V ((-a À —b) À -c)). 
p=(qg=r)). 

= q)=>r). 


cr © D 
PR LR RS 


Exercise 4 (Formulas and Priority) 
Give the tree representation of the following prioritized formulas: 


1 pes -qVr. 
2. pVq=TrAs. 
3 pVq=rTes. 
4 pVaqAT— -s. 
D. pTAsSs—t. 
6. pVqAsVt. 
7 pAg&-TVSs. 

8 —-pAgVT=> set. 


Exercise 5 (Height of a Formula, *) 
We define the height À of a prioritized formula as: 
e h(T) = 0 and h(L) = 0. 
e If Ais a variable h(A) = 0. 
e h(-A)=1+h(À). 
e h((A)) = h(A). 
e h(Ao B) = max(h(A),h(B)) + 1, if o is one of the following operations: V,A,=,<. 


1. Show that this definition is ambiguous, that is, show that there exists at least one 
formula (by presenting one) that can have two different heights under this definition. 
2. Give a new recuseive definition of height of à formula that does not have this problem. 


Exercise 6 (Validity) 

Give the truth table of the following formulas: 
L'p=(g=p). 
pe (qe) 
3 (pag) >(p=r). 


4 (p=æ(a=r) = (pag) = (p=r)). 


Indicate which formulas are valid, and which are equivalent. 


Exercise 7 ( Circular Reasoning) 
Give the truth table of the following formulas: a = b,b= cc a. a&b,b&candce a. 
Conclude that (a = b)A(b=c)A(c=æa)=(a&b)A(b&c)A(cs à). 


Exercise 8 (Equivalence) 

Give the truth table of the following formulas: 
1. pA(Va). 

. 7p À =q. 

- (p\a). 

- (PV a). 

- PV(pPAg). 

. 7p V =q. 

D. 


NOR & ND 


Indicate which formulas are equivalent. 


Exercise 9 (Equivalence) 
Give the truth table of the following formulas: 


2 


. (pq) A(q= p). 
p> 4. 

p& 4. 

: 74 > 79. 

. (PA g)V (pA-a). 


a & © ND + 


Indicate which formulas are equivalent. 


Exercise 10 (Equivalence) 
Which of the following formulas are equivalent to p = q V r? 
1. GA Tr = p. 
2. pA Tr = q. 
3. GA T = =D. 
4 qV-pVr. 


Exercise 11 ( Model for a set of formulas,*) 
Show that an assignment is a model for a set of formulas if and only if it is a model for the 
conjunction of all the formulas in the set. 


Exercise 12 ( Simplification Laws) 
Prove that for any x, y 

e zV(TAY)= x. 

e zA(TVY)= x. 

e zV(-xAY)=xV7y. 


Exercise 13 ( Simplification of Formula.*) 
Show by simplification that the following formula is a tautology. 


(a+b)-(b+c) = (a+c) 


Exercise 14 (Models and Normal Forms) 
Let À be the following formula: 


(as 0) SAV) (es. ad): 


1. Is À à tautology? (justify) 

2. Is À a contradiction ? (justify) 

3. Give the conjunctive normal form for À. 
4. Give the disjunctive normal form for À. 


Exercise 15 ( Natural induction,*) 
Show that if a formula contains only one variable and the operations V and A (no negation), 
then it is equivalent to a formula of size 0. 


Exercise 16 (Boolean Algebra) 
Using truth tables, determine if the operations =, are commutative, associative, idempo- 
tent, transitive. 


Exercise 17 (Boolean Algebra) 
Show that a formula with only one variable (say, that variable is p) is equivalent to either 0, 
1, p, or -p. 


Exercise 18 (Boolean Algebra) 
Write 16 formulas such that any formula with two variables, say p and q, is equivalent to one 
of those 16 formulas. 


Exercise 19 (Boolean Function) 
Determine the number of distinct (non-equivalent) boolean functions with k arguments (ex- 
press your answer as à function of k). 


Exercise 20 (Consequence) 

During an inquiry, adjutant Tinet makes the following reasoning: 
e If the murder occurred during the day, then the murderer is a friend of the victim 
e However, the murder occurred at night 


Therefore, the murderer is not a friend of the victim. Is adjutant Tinet correct? To determine 
this, proceed in three steps: 

1. Formalize the facts 

2. Formalize the reasoning that allows to arrive to the conclusion from the hypotheses 

3. Determine if the reasoning is correct. 


Exercise 21 (Consequence) 

Pinnochio, Quasimodo and Romeo are singing in a choir. They decide that: 
1. If Pinocchio does not sing, then Quasimodo will. 
2. If Quasimodo sings, then so will Pinocchio and Romeo. 
3. If Romeo sings, then at least one of Quasimodo or Pinocchio will not. 


Determine whether Pinocchio will sing. Justify your answer by formalizing the reasoning. 


Exercise 22 (Consequence) 
Formalize the following statements using logic connectors. 
(a) If Peter went home, then John went to the cinema. 
) Mary went to the library or Peter went home. 


(b 
(c) If John went to the cinema, then Mary went to the library or Peter went home. 
(d) Mary is not at the library and John went to the cinema. 

e 


(e) Peter went home. 
Is the last statement a consequence of the preceding ones? 


Exercise 23 (Normal Forms) 
For each of the following formulas, write the equivalent disjunctive normal form, and prove 
whether or not it is satisfiable (by giving a model for the formula if possible). 

e (a b)V(bAc) = c. 

e (a b)A(b—= -a)A(-a = b)A(b—= à). 


Exercise 24 (Normal Forms) 
Let À be the formula p V(gAr)& (pVq)A(pVr). Find the formula in disjunctive normal 
form equivalent to —A. Is À valid? 


Exercise 25 ( Normal Forms,**) 
We come back to the proofs regarding the transformation of formulas into normal forms. 

1. Show that the repeated application of the elimination of equivalence, elimination of 
implications and displacement of negations on a formula yields a formula in normal 
form. 

2. Show also regardless of the order in which the elinimation of equivalence, elimination 
of implications and displacement of negations are used, the algorithm for transforming 
a formula in normal form will terminate. 


Exercise 26 (Consequence and normal forms) 
Adjutant Tinet is on a new inquiry. His hypotheses are as follows: 
e If John did not meet Peter the other night, then Peter is the murderer or John is a liar. 
e If Peter is not the murderer, then John did not meet Peter the other night and the 
crime occurred after midnight. 
e If the crime occurred after midnight, then Peter is the murderer or John is a liar. 


He concludes that Peter is the murderer. Is his reasoning correct? Give your answer by 
constructing the conjunction of the hypotheses and the negation of the conclusion, and by 
putting this disjunction in conjunctive normal form. Recall that a reasoning is incorrect if 
and only if one of the monomials does not have any complementary litterals: this monomial 
gives a model of the hypotheses that is a counter-model of the conclusion. 


Exercise 27 (Formalization, sum of monomials*) 

On an isolated island, the natives are split into two tribes: the Tame, and the Lame. The 

Tame always tell the truth, the Lame always lie. We meet two natives: Aha and Beeby! 
(a) Aha says: “ At least one of us is a Lame ”. Can we deduce Aha and Beeby's tribe? 
(b) Aha says: “ At most one of us is a Lame ”. Can we deduce Aha and Beeby's tribe? 
(c) Aha says: “ Both of us are in the same tribe ”. Can we deduce Aha and Beeby’s tribe? 


Exercise 28 (Complete and incomplete set of connectors,**) 
À set of constants and connectors is called complete if any boolean function can be expressed 
with these connectors. Theorem 6.4 page 25 shows thaat the set {0,1,+,—,-} is complete. 

1. Show that the set {+,—} is complete. 

Hint: it suffices to show that {0,1,-} can be defined only with + and —. 

2. Show that the set {0, =} is complete. 

3. Let | be the following operation: x | y is true if and only if neither x nor y is true, that 
is x | y is true only if x = 0 and y = 0. This operation is also called NOR (for “not 
OR”) because it is the negation of the “OR? (V) connector. 

Show that {|} is complete. 

4. (*#) Show that the set {0,1,+-} is not complete. 

Hint: boolean function that are defined using only these operations have a property 
that is not true of all boolean functions. 

We say that a boolean function is monotone (or monotonic) if whenever a < b1,...,an < 
bn; then far. 8n) < (bis <br} 

Show that every boolean function defined only with {0,1,+,-} is monotone. 

Give a boolean function that is not monotone. Conclude that {0, 1, +,-} is not complete. 


This problem comes from a book by Raymond M. Smullyan : “ What is the Name of this Book ”, which 
describes many other amusing problems with these natives. 


5. (*) Is the set {1,—} complete? 
6. (**) Is the set {0,} complete? 


Exercise 29 ( Duality, recurrence,**) 

Consider formulas that only contains the operations 0,1,-,A,V. The dual of one of these 
formulas is obtained by turning conjunctions into disjunctions, 0 into 1 and vice versa. We 
write À* to denote the dual of formula À. 


1. Define A* y recurrence on these formulas. 
2. Show that if 2 formulas are equivalent, then so are their duals. 
Hint: let v be an assignment, and let ü be the assignment complementary to v (0 
becomes 1, 1 becomes 0). nes 
(a) Show that for every formula À above, [A*], = [AÏ;. 
(b) Deduce that if 2 such formulas are equivalent, then so are their duals. 


3. Deduce from the preceding question that if a formula is valid, its dual is contradictory. 


Exercise 30 (Canonical Form,***) 

Let Ti(p<i<n) be à list of n distinct variables. In this exercise, all the variables used in 
formulas are in this list. To any formula À, we associate a boolean function f(x1,...,æ») = À. 
This means that for a1,...a, € B, the value of f(a1,...,an) is the value taken by À when 
T1 = G1,...,€n = An. We say that two formulas À and B are in the same class if À and B 
are equivalent. 


1. How many classes of formulas (with our n variables) are there? 

2. We denote by @ le exclusive-or operation. We have x @ y = 1 if and only if x = 1 or 
y = 1, but not both (hence the name exclusive-or). We can also define this operation 
as æ®y = -(x & y). It should be clear that this operation is commutative, associative, 
that À distributes on @ and that 0 is the neutral element for &. Express negation, 
disjunction, implication and equivalence as an exclusive-or sum of 1’s and conjunctions 
or variables (1.e. like a formula in disjunctive normal form, except that the @ is used 
instead of V). 

3. Show that every boolean formula is equivalent to an exclusive-or sum of 1’s and con- 
junctions or variables. 

4. As à convention, the product of zero variables is considered to be 1 and the exclusive-or 
sum of zero variables is 0. Show that every boolean formula is equivalent to an exclusive- 
or sum of products such that not two monomials have the same set of variables. 

5. Fix an arbitrary ordering of the n variables used in the formulas (when variables are 
identifiers, we often use the lexicographic order). An exclusive-or sum of products of 
variables is in Reed-Muller Canonical Form if and only if: 

e the products do not contain any repeated variables, and inside each products, the 
variables are ordered from left to right in increasing order, 

e the products are orderes from left to right in inverse lexicographic order deduced 
from the ordering of the variables. 


Show that every boolean formula is equivalent to a formula in Reed-Muller Cacnonical 
Form. Deduce that the expression of a formula in Reed-Muller Canonical form is unique. 


Exercises for Chapter I.2 


Exercise 31 (Resolvent) 
Through resolution, we have: 
a+b a+b 


Show that: b+ b EE (a + b).(a + b). 


Exercise 32 (Resolvent) 
We recall that two clauses are equal if and only if they have the sets of literals. 
e Are the clauses p+q+T+q+p+s+q+T and s+q+7+p equal? 
e Are the clauses p + q +r +p and g+r+q+7r+aq+7 equal? Is one included in the 
other? Is one the consequence of the other? Are they equivalent? 
e Give all the resolvents of the clauses a +b+c and a+b+c. Are these resolvents valid? 


Exercise 33 (Proof) 
The following sets of formulas are unsatisfiable. 


e {a,a — b,b}. 


Prove that fact using resolution. 


Exercise 34 (Formalization and Resolution.,*) 
We note that: “ x unless y ” can be formalized as T & y. In a haunted house, ghosts show their 
presence in two ways: obscene chants and sardonic laughs. However, we can influence 
their behaviour by playing the organ or burning incense. Given the following: 

(i) The ghosts don’t do obscene chants unless we play the organ while the ghosts are not 

laughing. 
(ü) If we burn incense, the ghosts laugh if and only if they are also chanting. 
(ii) At the moment, the ghosts are chanting, but not laughing. 


And our conclusion: 
(iv) At the moment, we are playing the organ, but not burning incense. 


We define the following: 

e c: the ghosts are chanting. 
e o: we are playing the organ. 
e l: the ghosts are laughing. 
ei: we are burning incense. 


1. Transform the expression 7 & y into a product of clauses. 
2. Formalize the hypotheses and the negation of the conclusion into a product of clauses. 


3. Using resolution, prove that the reasoning is correct. 


In other words, transform the conjunction of the hypotheses and the negation of the conclusion 
into a product of clauses and deduce the empty clause. 


Exercise 35 (Proof,*) 
Show, using a proof by resolution, the correctness of the following reasoning: 


r+q—ttqa—=rqhter. 


Exercise 36 (Formalization and Proof,*) 
Show, using resolution, that the following reasoning is correct: 
e The weather is nice unless it is snowing. 
e It is raining unless it is snowing. 
e The weather is nice or it is raining. 
e Hence, it is not snowing. 


Exercise 37 ( Defining a Clause) 

A clause is either the empty clause, or a (non-empty) disjunction of literals. Give a inductive 
definition of a clause and define by recurrence the function s such that s(C') is the set of 
literals in clause C. 


Exercise 38 ( Proof) 
Prove the property 2.1.14 page 44 on the monotony and composition. 


Exercise 39 ( Property of Resolution) 
Prove property 2.1.8 page 43. 


Exercise 40 (+ Resolution does not add literals,*) 
Let l' be a set of clauses. A literal in lis à literal that appears in one of the clauses of F. 
Show that any clause deduced from [° only contains literals in [. 


Exercise 41 (Formalization and resolution) 
Consider the following hypotheses: 

1. If Peter misses his tournament then Peter will be depressed. 
. If the weather is nice then Peter will go to the swimming pool. 
. If Peter does not go to the swimming pool he will be depressed. 
. When at the swimming pool, Peter does not train. 
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. Peter will miss his tournament if he does not train. 


We would like to demonstrate that under such hypotheses, the following conclusion can be 
derived: 


6. Peter will be depressed. 


You will proceed as follows: 


e Formalize the hypotheses and the negation of the conclusion. 
e Deduce a set of clauses equivalent to your formal statements. 


e Show that the conclusion can be correctly derived from the hypotheses, by proving using 
the resolution method that the set of clauses is contradictory. 


Exercise 42 (Formalisation and resolution) 


The Beatles were a rock band formed in the 60’s in Liverpool. It was composed of four 
boys: Ringo Starr, Paul MacCartney, John Lennon and Georges Harrison. It has been quite 
hard to decide who would play which instrument, as the following extract from their discussion 
will show: 


Paul said: “If Ringo doesn’t play the guitar, then I will play the bass guitar and John the 
guitar.” 


Georges said: “I will play the guitar if, and only if, John plays it too.” 
John said: “If Paul plays the bass guitar, then Georges will play the guitar.” 


Ringo said: “T will play the drums and therefore, not the guitar.” 


After their talk, they settled on the following power four: 
e Ringo would play the drums, 
e Paul would play the bass guitar 
e John and Georges would both play the guitar. 


We will now show that every member of the band is happy with this conclusion. 


1. Formalise the 4 hypotheses and the conclusion using the following propositional vari- 


ables: 
e RD: “Ringo plays the drums”, 


e RG: “Ringo plays the guitar”, 
e PB: “Paul plays the bass guitar”, 
e JG: “John plays the guitar”, 
e GG: “Georges plays the guitar”. 
2. Transform the hypotheses and the negation of the conclusion into clauses. 


3. Prove, using resolution, that the conclusion is a consequence of the hypotheses. 


Exercise 43 (Reduction, X1603 Andrews) 
Soit l’ensemble de clauses : 


{p+ap+r+0+p,D+Ta+p+GatT+pr+aq+D+TT+a}. 


1. Reduce this set (reduction is defined in 2.1.4 page 48). 
2. Determine whether this set is satisfiable using resolution. 


Exercise 44 (DPLL) 
Consider the following set of clauses: 


{a+b+f,a+b+f,e+aa+bated+a+da+ba+c+d,d}. 


le) 


e Use algorithm Algo DPLL on this set of clauses. 
e Conclude whether or not it is satisfiable. 
e Ifit is satisfiable, give a model obtained from the trace of the algorithm. 


In the tree of calls, identify the steps as follows: 


e Elimination of valid clauses (VAL). 
e Reduction (RED). 

e Pure literal elimination (PLE). 

e Unit resolution (UR). 


In addition, note the assignments made at each step of the algorithm so that the model can 
easily be recovered. 


Exercise 45 (DPLL) 
Use algorithm Algo DPLL to determine whether or not the following sets of clauses are 
satisfiable: 

e {a+b+c+d+e+fa+b,b+a.c+dd+cb+cb+cb+ce,f}. 

e {a+b+c+d+f,a+b,b+a,c+d,d+c}. 

eo {b+j+aa+j+b,b+a+i,a+,i+b,b+5,7+0b,j+8,5+0b}. 

e {a+c+d,b+c+f,b+e+fc+e+f,e+f,c+dae+f}. 


Give a trace of the algorithm. 


Exercise 46 (Complete Strategy) 
Let L' be the following product of clauses: 


(a+b+c).(b+ c).(c + c).(b + c).(a + b + c).(a + b + co). 


Determine using the complete resolution strategy whether [is unsatisfiable, or if it has a 
model. Give à trace of the algorithm. Give the proof(s) you obtained. If T has a model, show 
it. 

Exercise 47 (Complete Strategy) 

Consider the following set of clauses: 


{p+agp+s,s+tig+nTrT+p+ig+z+2,q+r+s}. 
Use the complete strategy on this set of clauses and determine whether it is satisfiable or not. 


Exercise 48 (Complete Strategy) 

Consider the function f such that f(x,y,z) = 0 if and only if there is an even number of 
arguments with value 1. Express f as a product of clauses using the method described in 
subsection 1.6 page 32, then simplify f using the complete strategy. 


Exercise 49 ( Proof) 
Prove Lemma 2.3.2 page 55. 


Exercise 50 ( Proof) 
Prove Lemma 2.3.5 page 55. 
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Exercise 51 (From SAT to 3-SAT,***) 
SAT (short for Satisfability) is a decision problem stated as follows: “given à set of clauses 
T', determine if T has a model”. 3-SAT is a restriction of this problem in which each clause 
in L' contains exactly three literals. 

SAT is an NP-complete problem [5]. In this exercise, we study a polynomial-time reduction 
from SAT to 3-SAT, thereby showing that 3-SAT is also NP-complete?. 

À polynomial-time reduction from SAT to 3-SAT is à polynomial-time transformation of 
the set of clauses T into a set of clauses L” verifying the following two properties: 


(a) all the clauses in [” contain three distinct literals. 
(b) T has a model if and only if [” has a model. 


Usually, such reductions also satisfy the following additional property: 


(c) Any model for l” is also a model for T. 


The goal of this exercise is to show that the polynomial-time transformation below verify 
these three properties. Note that the transformation potentially introduces new variables. 

Let T = {c,...,cn} be a set of clauses. The reduction consists in replacing every clause 
G = 2 +...+2% of T (where each 2; is a literal) by a set of clauses C? constructed as follows, 
depending on the value of k: 


k=1: Cl = {2 + y + y, 1 + y +9, 1 + Yi + ÿ, 1 + Yi + Y} where y1 and y are new 
variables (not present anywhere else). 


k=2: = {2 +22 + y, 1 + 22 +1} where y is a new variable. 


kR>3: Ci = {a +22 +, Ur + 23 + Yo, Va + 24 + Us, Ua + 26 + V4, ..., Yes + 21 + x} 
where y1,...,yx-3 are new variables. 


Finally, I” = [J7, Ci. 


By construction, the reduction certainly verify property (a). The answers to the following 
questions allow us to prove properties (b) and (c): 

1. Show (without a truth table) that any assignment will give the same value to c; as to 
the conjunction of all the clauses in C? when c; consists of only one literal. 

2. Show (without a truth table) that any assignment will give the same value to c; as to 
the conjunction of all the clauses in C? when c; consists of two literal. 

3. Let c; be a clause with more than 3 literals. Show that if c; has a model, then C{ also 
has a model. 

4. Let c; be a clause with more than 3 literals. Show that any model for C! is also a model 
for c;. 

5. The reduction above maintains satisfiability. Show that the reduction does not maintain 
the meaning of the set of formulas. That is, the conjunction of all the clauses in [is 
not equivalent to the conjunction of all the formulas in [”. 


?We note that the k-SAT is not NP-complete for any value of k: 2-SAT can be solved in polynomial time. 
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Exercises for Chapter L.3 


Exercise 52 (Proof Sketch) 
The following sequence of lines is not a proof sketch. Find the smallest number à such that 
lines 1 to à — 1 is a proof draft, but lines 1 to à is not. Give the context of lines 1 to à — 1. 


context | number | proof 


suppose & 


Suppose b 
C 

Thus d 
suppose € 


É 
Thus g 


h 
i 


OO QI 


Thus 7 
Thus k 
l 


lrH 
HR|© 


= 
ND 


Exercise 53 (Proof of Formulas Requiring Special Rules) 
Give a proof of the following formulas: 

ea —> ——a, 

e ——a— a, 

ea a, 

e aV —a. 


Exercise 54 (Simple Proofs of Formulas) 
Give a proof of the following formulas: 

e a = c in environment a = b, b= c. 

e (a b)A(b=c) = (a c). 


(ab) (bc) (a c)). 


Exercise 55 ( Abbreviations) 

Let À be à formula and u fld(A) be the formula obtained by replacing in À the negations and 
equivalences (in abbreviated form) by their definition. ufld(A) is the formula obtained by 
“unfolding”, hence the name ufld chosen for the unfolding function. 


e Define the function ufld by recurrence. 
e Show that the formulas À and ufld(A) are equivalent. 
e Deduce that two formulas, equal up to abbreviations, are equivalent. 


Exercise 56 (Proof of Formulas) 
Give a proof of the following formulas: 


1. a = (b= à). 
2. a Ab= a. 
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nds (db); 

(a (b=c))=((a=b)= (a c)). 
a\b—=bAa. 

aVb=bV a. 

(bee bd) 

(an bo) Ses. (bo) 

s (abc dr (acs bd): 
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Exercise 57 (About implication) 
Give a proof of the following formulas: 


1. a = b in the environment -a V b. 


NÉ a) = (a = b). 


Exercise 58 (Boolean algebra) 
Give a proof of the following formulas: 


1. —(a A -a). 

2. aVa— a. 

3 a\a—> a. 

4 aA(bVc) a bVanc. 
5. aAbVaAc—=æaA(bVoc). 
6. aVbAc=(aVb)A(aVe). 
7. (aVb)A(aVc)=aVbAc. 


Exercise 59 ( Proof of Formulas with Environment) 
Give a proof of the following formulas: 

e P1: BVC'in environment -B = C. 

e P2: -BVC' in environment B = C. 

e P3: -BV -C'in environment -(B AC). 

e P4: -B in environment -(B VC). 

e P5: -C'in the same environment -(B VC). 

e P6: B in the same environment -(B = C). 

e P7: -C'in the same environment -(B = C). 


Exercise 60 (Proof of Formulas) 
Give à natural deduction proof of the following formulas: 
1. —(a V b) = (-a À -b). 
(-a A -b) = -(a V b). 
(#) (a V -b) = -(a A b). 
LÉ av A Sa NV) St 
(Fa Ab) Sa Vs): 


UE & N 
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6. (**#) (aVb)A(—-bVc) = aVc. 


Exercise 61 (Midterm 2011) 
Prove the following formulae using natural deduction : 


e (p=æLl)A(-pAg=1) = -q 
e (DVa)V(pVr)A-p—æqvr 
e F(p=L)V(pAg=L) = -QVv -p 


Exercise 62 (Midterm 2013) 
Give a proof of the following formulae using the natural deduction in the table format : 


e (pVg) = (-pA-qg)=>r. 
e ((p—qgA(g=æ Tr) A -r = -p. 
e (pq) = ((pAg)V-p). 


Exercise 63 (Questions from various midterm exams) 


1. Prove the following formula using natural deduction: (pVq)A(p=r)=qVvr 
2. We consider the hypotheses: 


e (H1) : If Peter is tall, then John isn’t Peter’s son. 
e (H2) : If Peter isn't tall, then John is Peter’s son. 
e (H3) : If John is Peter’s son, then Mary is John's sister. 


Formalize and prove that from these we can deduce conclusion (C) : “Mary is John's 
sister or Peter is tall or both” using natural deduction. 
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Exercises for Chapter II.4 


Exercise 64 (Structure and free variables) 


For each formula hereafter, indicate its structure and its free variables. 


1. Vr(P(x) = 3yQ(x, y)). 

. VaVb(b Z 0 gdr(a=bxq+rAr<b)}. 

. Even(x) & y(x = 2 * y). 

. Divides(x,y) & 2z(y = 2 *xx). 

. Prime(x) & Vy(Divides(y, x) = y=1Vy= 7x). 
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Exercise 65 (Formalization, function and relation symbols) 
Consider 2 = {b"2,u"?, c'2,0"2,r/0, ff}, à signature with the following meaning: 
e b(x,y) := x is one of y’s brothers. 
e u(x,y) := x is one of y’s uncles. 
e c(xr,y) := x is one of y’s cousins. 
e o(x,y) := x is older than y. 
e ris Robert’s nickname. 
e f(x) returns x’s father. 


Formalize the following sentences in first order logic using signature Y. 


1. Every brother of Robert’s father is Robert’s uncle. 
2. If the fathers of two children are brothers, then these children are cousins. 
3. One of Robert’s cousins is younger than one of Robert’s brothers. 


Translate in English the following logical propositions: 


1. —2x o(x,p(x)) 

2. VaVy(f(f(x)) = f(F(y)) = (x, y)) 
3. VrAy(b(x, y) À o(y,x)) 

4. 3x2y(b(x, y) À (f(x) = f(y))) 


Exercise 66 (Formalization) 
Consider signature E = {g/0, f/0, pr2,W"?}, whose symbols have the following meaning: 


e g:= Germany’s team. 

e f := France’s team. 

e P(x,y) := x played against y. 
e Wi(x,y) := x won against y. 


Formalize the following sentences in first order logic using siganture Y. 


1. France’s team won a match and lost a match. 
2. France’s and Germany’s team tied. 
3. À team won all its matches. 


In order to respect the usual notation for the Euclidean Algorithm, we exceptionally use a, b, q and r as 


variable names 
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4. No team lost all its matches. 

5. Consider the following assertion: “AIl the teams who played against a team that won 
all its matches won at least one match”. Which of the following formulas formalize this 
assertion, and which are equivalent? 


(a) Vry (P(x, y) À Vz(P(y, 2) = W(y,z)) = HW(x,v)). 
() Vr(ay (P(x, y) A Ve(P(y, 2) = W(y,2))) = W(x,v)). 
(c) 2x(Vy (P(x,y) = Wix,y)) = Vz(P(x, 2) = 0W(x,v))). 
(d) VaVy (P(x, y) À Vz(P(y, 2) = W(y,2)) = tW(x,v)). 
(e) Va(Vy (P(x, y) A Ve(P(y, 2) = W(y,2))) = W(x,v)). 


Exercise 67 (Formalization,**) 
We define constants s for Serge, t for Tobby, L(x, y) for x loves y, D(x) for x is a dog, P(x) for 
zis a pet, K(x) for x is a kid, B(x) for x is a bird and S(x,y) for x is scared of y. Describe 
the signature Y associated for these symbols, and formalize the following statements in first 
order logic using that signature. 
1. Dogs and birds are pets. 

. Tobby is a dog that loves kids. 

. Birds do not like dogs. 

. Serge loves all pets except dogs. 


2 
3 
4 
5. All kids are not scared of dogs. 
6. Some dogs love kids. 

7. Some dogs love kids, and vice versa. 
8 


. Kids love some dogs. 


Exercise 68 (Evaluation of unary predicates) 

Let I be the interpretation on domain D = {0,1} with Pr = {0} and Q7 = {1}. 
. Evaluate the following formulas with 7: VxP(x) and Vx(P(x) V Q(x)). 

. Are the formulas VxP(x) V VxQ(x) and Vx(P(x) V Q(x)) equivalent? 
. Evaluate the following formulas with 7: 2xP(x) and 2x(P(x) A Q(x)). 
Are the formulas 2x P(x) À 3xQ(x) and 2x(P(x) À Q(x)) equivalent? 
. Evaluate the following formulas with 7: Vx(P(x) = Q(x)) and VxP(x) = VrxQ(x). 
. Are the formulas Vx(P(x) = Q(x)) and VxP(x) = VrQ(x) equivalent? 


Exercise 69 (Interpretation.*) 
Consider the following formulas: 


1. Vady(y = x +1). 

2. yVx(y = x +1). 

3. Vaay(y = x +1) = yVr(y = x +1). 
4, VaZy(z = y +1). 

5. x Vy(y = x + y). 

6. x(r Z0AT+x=xX). 


and the following interpretations: 
1. Il is Boolean Algebra on {0,1}. 
2. 12 is the usual arithmetic on natural numbers. 
3. 13 is the usual arithmetic on rational numbers. 
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4. I4 is the Boolean Algebra on P(X) where constants 0 and 1 denote the sets Ÿ and X, 
and addition represents set union. 


Indicate if these interpretations are models or counter-models of the formulas above. 


Exercise 70 (Unary predicats and equality) 
Let I be the interpretation on the domain D = {0,1,2} with Pr = {0,1}, Q7 = {1,2}, Rr = {}. 
Evaluate the following formulas with this interpretation: 


1. RE): 


DEN 
< 
8 


Exercise 71 (Evaluation, equality) 

We use the unary function symbol f and the constant a. Let x Æ y be a shorthand for 
(x = y). We define interpretations 1, 2 on domain {0,1,2} as follows: 

an = QG] = (0. 


f(x) | fn(x) 


DIr|ols 


0 1 
0 2 
2 0 


In interpretation 1;, then in 12, evaluate the following formula: 


Le: 

2. f(/(a)) = a 

3. f(F(F(a)) = a 

4. 2x(f(x) = x), (f has a fixed point). 

5. Va(f(F(F(x))) = x). 

6. Vyx(f(x) = y), (f is surjective, or onto). 

7. VaVy(f(x) = f(y) = x = y), (f is injective, or one-to-one. 
8. 


( 
Dr y( f(x) = f(y) A x À y). 


Exercise 72 (Formalization and evaluation) 
We use the following notation: 


e P(x) means x passed his exam 
e Q(x,y) means x called y 


Give the signature associated with these symbols, and formalize the following statements: 
1. Someone failed the exam and was not called by anyone. 
2. All those who passed the exam received a call. 
3. Nobody called those who passed the exam. 
4. All those cho called someone else called someone who passed the exam. 


#This formula means that there is only one element satisfying P. 
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We define an interpretation with domain D = {0,1,2,3}. Let Anatoli, Boris, Catarina 
and Denka be four constants with value 0, 1, 2, 3 respectively. Anatoli and Boris are boys, 
Catarina and Denka are girls. In our interpretation, only Boris and Catarina passed the 
exam, every boy called every girl, Denka called Boris, Catarina called Denka and no other 
calls were made. Evaluate the statements above in this interpretation. 

Indication : to facilitate the evaluation, it might help to represent the interpretation picto- 
rially, by circling people who passed the exam and drawing an arrow from x to y if x called 


U. 


Exercise 73 (Expansion and counter-models) 
Using the method of expansion, find counter-models to the following formulas: 


LP) = h(P(&) À Or). 


PS QI RS QE) 
VaPSs OS CrPeVrO()): 
(x (r) = Gr) = Vr(Fl) = G(x)): 


VadyR(x,y) = R(z,x). 
ay (R(e y) = RES VeRr, x): 


maE x 


Hint : it should be enough to build 1 or 2 expansions. 


Exercise 74 (Incorrect reasoning) 
Consider the following hypotheses: 

1. =5P(c). 

2 QE). 

3 NECPONNOCGE) SRE" 


Show that it is incorrect to deduce from these that xR(x). 


Exercise 75 (Counter-model with a relation) 
Construct counter-models for the following formulas, where F is a relation: 
l'Viu =) Nr = x). 
FAN (Gb) = F (D): 
Nr) AP (or y) Ver (x). 
dE Vatu lieues eu)e Per). 


Exercise 76 (Counter-model with a function) 
Construct counter-models for the following formulas, where f is a function and P is a relation 


1. Vyar(f(x) = y). 

2. VaVy(f(x) = f(y) = x = y) 
3. xVy(f(y) = x). 

4. Vx(P(x) = P(f(x)) 


Exercise 77 (Equivalences) 
Prove that 
1. —VrdyP(x, y) = 2yVr-P(y, x) 
2. x(P(x) = Q(x)) = VzP(x) = 3rQ(x). 
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3. The sentence “no sick person likes charlatans” was formalized in first order logic by two 


students as follows: 
e VaVy((S(x) À L(x,y)) = -C(y)) . 


Ar(S (x) À (Ay(L(x, y) À C(y))))). 
Show that both students are saying the same thing, that is, these two formulas are 
equivalent. 


TS 


© — 


Exercise 78 (+ , Proofs,*) 

Prove the following two equivalences from Lemma 4.4.1: 
3xA = Yx-A. 

x À = -Vx-A. 


J 


e 
Hint : use properties 1 and 2 from Lemma 4.4.1. 


Exercise 79 (Proof) 

We know that (Vx(A A B)) = (A A (VxB)) under the condition that x is not a free variable 
in À, as mentioned in paragraph 4.4.2. Show that this condition is necessary by giving an 
assignment that give different values to the formulas Vx(P(x) À Q(x)) and P(x) A (VxQ(x)) 
when this condition is not met. 
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Exercises for Chapter IL.5 


Exercise 80 (Herbrand Universe) 
Let Y be the signature with constant a and function symbols f and g of arity one and two 
respectively. 


e Give 5 distinct elements of the Herbrand universe of this signature. 
e Give an inductive definition of this Herbrand universe. 


Exercise 81 (Signature, Herbrand Universe and Base) 
For each of the following sets of formulas, 


e Li = {P(x) V Q(x) V R(x),-P(a), -Q(b), -R(c)}. 
e Lo = {P(x),-Q(x),=P(f(x)) V Q(F(x))}. 
e La {P(x), Q((x)), RFC), PF (x) V =Q(x) V R(F(x))}- 


1. Give the signature, and the corresponding Herbrand universe and base. 


2. Prove whether or not their universal closure has a model. 


Exercise 82 (Herbrand’s method) 
Use Herbrand’s method in order to prove that the following set of formulae is unsatisfiable: 


Exercise 83 (Herbrand’s method,*) 
Use Herbrand’s method in order to prove that the following set of formulae is unsatisfiable: 


1. Vr(Q(x) V -P(f(x))) 

2. Vy(Q(y) = R(y)) 

3. Vz(-P(2) = Q(:) VR(:)) 
4. Vu-R(u) 


In particular, you will have to transform your set of unsatisfiable instances into an equivalent 
set of clauses. Then, you will prove that it is contradictory with a proof in propositional 
resolution. 


Exercise 84 (Herbrand’s method,*) 
Let T' be the following set of formulae: 
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5. S 


6. S(c,b) 


Find à finite unsatisfiable set of closed instances of these formulae. 
This enables us to deduce something about a set of first-order formulae : 


what ? 


Exercise 85 (Herbrand Model,***) 
Let À be the following set of formulas: 


LT <YAY<IZRT< 2. 


Pam CO 


3 z<y—z< f(x,y) A f(x,y) < 


4 a <b. 


e Give a model of V(A). 


e Does V(A) have a model on the Herbrand universe created from à, b, f ? 


Exercise 86 (Skolemization) 
Skolemize the following formulas (pay attention to the negations !) then transform them in 
clausal form. 


1. — 


(= 


iP(IVa 


rOÛCr) = dx(P( 


YU. 


x) V Q(x))). 


2. —-(VrVyVz(e(x, y) À ely, z) = -e(x,z)) = —-2xVy ex, y)). 


3. 


4. Vx((= 


D. — 


answer. 


(= 


yP(x, y) À -3 


—(—-VrP(x) V -VrQ(x) = -(VrP(x) À VrQ(x))). 


yP(x,y) = rQ(x)) 1 3 


xQ(x)). 


aVyWz((P(y) = Q()) = (P(x) = Q(x)))) 


Exercise 87 (Unification) 
Are the following terms unifiable? If so, give their most general unifier, if not, justify your 


e h(g(x), fa, y),z) et h(y,z, f(u,x)). 
e h(g(x), fa, y),z) et h(y,z, fu, g(x))). 


Exercise 88 (Unification) 


Give the most general unifier for each of the following terms if it exists. 
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which set and 


1. R(a, f(x)) = R(y. f(g(y.b))), 

2. R(y, f(x)) = Rx, f(g(y.b))), 

3. Q(y, f(a), f(x)) = Q(g(a,b),x, f(y)), et 

4 Q(y, f(x), g(u, x)) = Q(x, (y), g(F (a), y)). 


Exercise 89 (Unification) 
Give the most general unifier for each of the following terms if it exists. 


1. pair(a, crypt(z,b)) et pair(x, y). 

2. pair(crypt(x, b), crypt(y,b)) et pair(crypt(a, b), 2). 
3. crypt(pair(z,a),x) et crypt(pair(y, crypt(x, b)),b). 
4. crypt(pair(a, z),x) et crypt(pair(y, crypt(x, b)), b). 
5. f(x,y,g(a,a)) et f(g(y, y), 2,2) 

6. f(x,y,a) et f(y,g(2,2),x) 


Exercise 90 (Unification with multiple solutions) 
The equation f(g(y),y) = f(u,z) has two most general unifiers (Recall: they are therefore 
equivalent). Give these two solutions. 


Exercise 91 (Proof by resolution.*) 
Show that the following formula is valid by transforming its negation in clausal form and by 
finding a contradictory set of instances of the clauses. 


VitPlx) S OÙ)) = (rl) = VrO(e)). 


Exercise 92 (Proof by resolution,**) 
Consider the following formulas: 


Le RPGr= Vlr): 


2. H2 = Vx(P(x) V Q(x)). 


3 C= QG) = ViP (cl): 
We want to show that C is the consequence of H; and 2 using instantiation and resolution. 
1. Transform the three formulas H1, H2, -C' in clausal form. 


2. Find contradictory instances of the clauses obtained and show by propositional resolu- 
tion that these instances are contradictory. 


3. Give a direct proof of this contradiction using factorization, copy and binary resolution. 
It is possible that you only need the last rule. 


Exercise 93 (Proof by resolution,**) 
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e Using a proof by factorization, copy and binary resolution, prove that the universal 
closure of the following set of clauses is unsatisfiable: 


P(F(x)) V -Q(y, a). 

(a, a) V R(x,x,b) V S(a,b). 
V=R(r,#,b): 

c)) V'R(x, 0, b): 


SUR RM ENS LE 


e Using a proof by factorization, copy and binary resolution, prove that the universal 
closure of the following set of clauses is unsatisfiable: 
L  PGE), 
2. —P(y) V Q(y,x). 
3. —Q(x,a) V -Q(b,y) V -Q(b, a) V -P(f(y)). 


e Using a proof by factorization, copy and binary resolution, prove that the universal 
closure of the following set of clauses is unsatisfiable: 


—(b <x+b)V(a+b< a). 
b< z. 
. (a+b< x) V -R(y,b). 


D a À & NN n 


Recall : The symbol + has à higher priority than the symbol <, which itself has a 
higher priority than binary connectors. 


Exercise 94 (Unification, resolution) 
Let F1 = {P(x, f(x,b),u),-P(g(a),z,h(2))} and lo = {P(x, f(x,b),u), -P(g(2), 2, k(2))} 
Are the sets V(T1) and V(T2) satisfiable or unsatisfable? 


Exercise 95 (Skolemization and First Order Resolution) 
The goal of this exercise is to prove the following syllogism: 


Vx(man(x) = mortal(x)) À man(Socrates) = mortal(Socrates) 
e Skolemize the negation of the syllogism. 
e Transform the obtained Skolem form in clausal form. 
e Demonstrate by instantiation that the negation of the syllogism is a contradiction. 


e Demonstrate using factorization, copy and binary resolution that the negation of the 
syllogism is a contradiction. 


Exercise 96 (Clausal Form and Resolution,**) 
Consider the following formulas: 
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1. A1 = JuVu(P(u) A (R(v) = Q(u,v))). 
2. A2 = VuVu(-P(u) V -S(v) V -Q{u,v)). 


3. A3 = u(R(v) A S(v)). 
Show that the set containing these three formulas is contradictory using resolution: 
1. Transorm A1, A2, A3 in clausal form. 


2. Find contradictory instances of the clauses you obtained and show this contradiction 
using propositional resolution. 


3. Make a direct proof of L using factorization, copy and binary resolution. 


Exercise 97 ( Coherence of First Order Resolution ) 
Prove the coherence of first order resolution, that is: 


Let T be a set of clauses and C a clause. IfT Hire C then V(T) E V(C). 


Exercise 98 (Clausal Form and Resolution,**) 
Consider the following formulas: 


1. Pr VE = 5) 

2, Es = Niue ===): 

3. E3 = VaVyVaVt(x = yAz=t= (rez yet)). 
4, C'=VyVi(y = 2 Vr(reyezez)). 


E:,E», E3 are axioms of equality: Æ1 says equality is reflexive, E2 says it is symmetric, E3 
says it is a congruence relative to €. We do not use transitivity in this exercise. C says that 
two sets are equal if they have the same elements. We note that in this exercise, the symbol 
‘— is not treated as usual, as the symbol with fixed meaning describing the identity relation. 
The restriction on the appearance of the equality symbol in formulas applies only when it 
is considered as a symbol with fixed meaning. Show that C is a consequence of the other 
axioms on equality: 


1. Put the formulas Æ1, E2, E3, -C' in clausal form. 
2. Find contradictory instances of the clauses you obtained. 
3. Show a direct proof of L using factorization, copy and binary resolution. 


Exercise 99 (Clausal Form and Resolution,**) 
Consider the following formulas: 


1. Hi = Vu(vR(u, v) = R(u, f(u))). 


2. H2 = VuavR(u,v). 
3. H3 = IuR(F(F(u)),u). 
4. C' = uvauw(R(u, v) À R(v, w) À R(w,u)). 
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Show that C is the consequence of H1,H2, Ha. 
1. Transform the formulas H;, H2, H3, -C in clausal form. 


2. Find contradictory instances of the clauses you obtained, and show the contradiction 
using propositional resolution. 


3. Prove this contradiction directly using factorization, copy and binary resolution. 


Exercise 100 (Clausal Form and Resolution,**) 
Let F(x,y) be a formalization of “ x is y’s father ”. Let A(x,y) be a formalization of “ x is 
y’s ancestor ”. Consider the following formulas: 


L: H= Niue (y). 


2. Ho = VaVyVz(F(x, y) À F(y,2) = A(x,2)). 


3. C'=VrZyA(x, y). 


Show that C is the consequence of H;, H2 by transforming H;, H2,-C into clausal form, and 
deriving the empty clause using factorization, copy and binary resolution. 


Exercise 101 (Bernays-Schonfinkel Formula,***) 

ABS (Bernays-Schonfinkel) formulais a closed formula without any function symbols, of the 
form 271...-%,Vy1...Vy, B, where B does not have any quantifiers. Show how to decide 
the satisfiability of such a formula. 
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Exercises for Chapter II.6 


Exercise 102 (Natural Deduction) 
Prove the following formulas using natural deduction: 


1. The famous syllogism, “AIl men are mortal, Socrates is a man, therefore Socrates is 
mortal”, which we formalize as Vx(H(x) = M(x)) A H(socrates) = M(socrates). 


2: VeP(E) = gl (y). 


OVTP(E) = Pc): 


4. Vx(P(x) À Q(x)) = VxP(x) A VxQ(x). Note that example 6.1.2 gives the proof of the 
reciprocal. 


Be (Pr) VO(c) = Pa) VO (E) 


KP) = Qi): 


8. Vx(P(r) = Q(x) 


) 

T. Pr) VrQ (x) = (PE) VO(EN: (5) 
YAVEQ(G)S= RG) ES Vlr) = Rx)): 
) 


dL'Yr(P) SOA Q(G)= x -=P(r): 
In this exercise, the formulas P(x) and Q(x) can be replaced by any other formulas. 


Exercise 103 (Natural Deduction) 
Prove the following formulas: 


1. VaVyP(x,y) = VyVrP(x, y). 
2. Jr dyP(x,y) = ydrP (x, y). 
3. VyP(x,y) = VyaxP(x, y). 
4 Vr(Q(x) = Vy(R(y) = P(x,y))) = Vy(R(y) = Vr(Q(x) = P(x,y))). (°) 


In this exercise, the formula P(x,y) can be replaced by any other formula. However, Q(x) 
can only be replaced by a formula that does not have y as a free variable, and R(y) can only 
be replaced by a formula that does not have x as a free variable. Explain the reason for these 
constraints. 


Exercise 104 (Find the Mistake) 
Consider the following formula: 


PH) ANTr OS (PIN OI): 


Among the following three natural deduction proofs, only one is correct. Identify the 
correct proof, and justify why the other two are incorrect. 


1. 
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context | number | proof justification 

1 L Suppose x P(x) A Vx Q(x) 

1 2 2 Pc) AE1 1 

1 3 Vx Q(x) A\E2 1 

1,4 4 Suppose P(x) 

1,4 5 Q(x) VE ST 

1,4 6 P(x) A Q(x) A] 4,5 

1,4 4 Jx(P(x) À Q(x)) AI 6, x 

1 8 Thus P(x) = 2x(P(x) A Q(x)) =] 4,7 

1 9 PEN DO (E)) 1E 2,8 
10 Thus Po) AVE QC) = (Po) AO) | 'ST19 

2: 

context | number | proof justification 

1 1 Suppose 4x P(x) A Vx Q(x) 

1 2 PE) AE1 1 

1 3 Vx Q(x) AE2 1 

1,4 4 Suppose P(x) 

1,4 5 Q(x) VE T 

1,4 6 P(x) A Q(x) AT 4,5 

1 7 Thus P(x}= P(x) A O(s) =] 4,6 

1 8 P(x) A Q(x) JE 2,7 

ï 5 Fx(P{) À QU) 19, x 
10 Thus 6: P(r) Ave Q(e) = (P(r) A QE) EL TL 

3. 

context | number | proof justification 

1 1 Suppose 4x P(x) A Vx Q(x) 

1 2 PE) AE1 1 

1 3 Vx Q(x) AE2 1 

1,4 4 Suppose P(x) 

1 5 Thus P(x) = P(x) =] 4,4 

1 6 P(x) 2E 2,6 

1 7 Q(x) VE 3, x 

1 8 P(x) A Q(x) A 7,8 

1 9 Ix(P(x) A Q(x)) = 
10 Thus Ar P(r) AVE QE) = (P(&) A Q(E)) | SI L,10 


Exercise 105 (Copy) 


Prove VrVyP(x,y) = VaVyP(y,x) using natural deduction with as few copies as possible. 


Exercise 106 (Natural Deduction) 
Prove the following formulas using natural deduction (note that Q is a propositional variable): 
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1. Vx(Q À P(x)) = Q A VzP(x 
2. Q AVxP(x) = Vr(Q À P(x) 
3. Vx(Q V P(x)) = Q V VrP(x). (**) 
4. QVYxP(x) = Vx(Q V P(x) 


). 
). 
). 
). 
5. 2x(Q À P(x)) = Q A KP(x). 
). 
). 
). 


OA EPE) Sr (0 APE) 
1: OV P())SQV AP (x 
8.0 V1 PG)= NOV P(e) 


(°) 


In this exercise, the formula P(x) can be replaced by any formula. However, Q can be replaced 
only by a formula that does not have x as a free variable. 


Exercise 107 (Proof) 
Prove the formula —-23xP(x) = Vx-P(x). Verify that P(x) can be replaced by any formula. 
Note: the reciprocal to this formula is proven in example 6.1.6. 


Exercise 108 (Equality) 
Prove the following formulae: 


1. R(a,c) A (a = b) = R(b, c). 
2. my f(x,2) = f(y,2). 


3. Valdy(x = y): 


4 Vyr=y = Navy = y. (") 


Exercise 109 (Equality,**) 
Prove that the second definition of “ there exists one and only one” (see subsection 6.2.3) 
implies the first, that is, prove the formula: 2xP(x) À VaWy(P(x) À P(y) = x = y) = 
Ax(P(x) À Vy(P(y) = x = y)). 


Exercise 110 (Induction and natural deduction,***) 
We can define addition using the following formulas: 


(a) Vn(n +0 = n). 
(b) VnVp(n + s(p) = s(n + p)). 


These two formula allow us to do additions: we can prove, among other, that s(0) + s(0) = 
s(s(0)). But they do not allow the proof of more general properties of addition, which require 
the recurrence principle. 


1. Show that from hypotheses (a) and (b), we cannot deduce Vn(0 + n = n). 


2. We give the name P(n) to the property above and describe the recurrence principle on 
this property as follows: 
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(c) Vn(P(n) &0+n=n). 
(d) P(0) A Vn(P(n) = P(s(n))) = VnP(n). 
Prove using natural deduction that (a) À (b) À (c) A (d) = VnP{n). 


Exercise 111 (Exam 2009) 
All of the following proofs must be justified. 


1. Prove using natural deduction that this formula is valid: 
Ar p(x) = Vx q(x)) = Vr(p(x) = q(x)). 


TRS 


2. Prove using natural deduction that this formula is valid: 


Ar p(r) À Vr(p(x) = p(f(x))) = 3 p(f(F (x). 


3. We denote by f”(x) the term obtained applying f n times to x. 
For instance, f0(x) = x, f(x) = f(x), f*(x) = f(f(x)). 
Let l', À be two formula sets and À, B two formulas. We remind l'H À is true if there 
is a proof of À in the environment T.. 
We give some trivial properties of the H relation 


Monotony : if l'H À and J € A then A+ A 
Composition : if l'+ Aandl'+A=Bthenl+B 


(a) Prove using natural deduction of the following property: 
Va(p(x) = p(f(x))) + p(f"(x)) = 3x p(fT (x) 

(b) Deduce from the above property, monotony and composition that for any natural 
integer n : 

dr p(x), Vr(p(x) = p(f(x))) F 3x p(f"(æ)) . 


Exercise 112 (Exam 2012) 
Prove the following formulas using first-order natural deduction: 


1. —VrP(x) V =4yQ(y) = =(VzP(x) À 1yQ(y)) 
2. VaVy(P(y) = R(x)) = 2yP(y) = VrR(x) 


Wen Pt) = EP (à) 


Exercise 113 (Exam 2013) 
Prove the following formulae using first order natural deduction. 


HO S PENAVrO (Er) rl fr) 
2, Va Vu(R(E = Ro) Vis Rx) 


1. 


Exercise 114 (Questions from various exams) 
Prove the following formulae using first order natural deduction. 


LL AP) VO) AVE Or) = Pc) 
2: Va(P(a) = Q(aN A (P(r) AR(x)) = Ar(QCr) A R(x)) 
API Va Pal) =VEel (Cr) 


3. 


29 


Partiel INF402 


Frédéric Prost Benjamin Wack 


16 mars 2023 
2 pages 
Total : 120 points 
Durée : 2h00 


Documents autorisés : une feuille recto verso de notes manuscrites format A4. 

Le barème est indicatif, les points correspondent au nombre de minutes nécessaires pour réaliser les exercices. 
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Exercice 1 (Formalisation (20 points)) 
Considérons le raisonnement suivant. 


2. 
3. 


Dieu est omnibienveillant. 

Si la causalité était transitive, on en déduirait que : si Dieu est la cause de l’existence de l'humanité, il 
s'ensuit que Dieu a causé le changement climatique si c’est l'existence de l’humanité qui l’a causé. 

Or, tout bon scientifique doit admettre que c'est l’activité humaine qui a causé les problèmes de climat 
actuels. 

Mais bien que tout bon croyant sache que Dieu a créé l'humanité, un Dieu responsable du changement 
climatique global ne peut pas être omnibienveillant. 

On en déduit que la causalité est non-transitive. 


. Formalisez ce raisonnement en logique propositionnelle, en reformulant les affirmations si nécessaire. 


Ne perdez pas de temps à comprendre les affirmations, concentrez-vous sur les connecteurs logiques. 
Trouvez une assignation qui satisfait les hypothèses. 


Que pouvez-vous en conclure à propos de ce raisonnement ? 


Réponse: 
On définit les variables propositionnelles : 


P1: Dieu est omnibénévolent. 
P2: Dieu a causé l’existence de l’humanité. 
P3: Dieu a causé le changement climatique. 


La causalité est transitive. 
L’humanité est la cause du changement climatique. 


Le raisonnement se traduit par les formules : 


P1 
Q — (P2 = (R — P3) 
R 
P2A(P3 — -P1) 
F Q 
L’assignation suivante : 

Pl TT 

P2: TT 

PSE CE 

Q: L 

R: OT 


est le seul modèle des hypothèses. 
Comme c’est aussi un modèle de -Q, le raisonnement est correct. 


Exercice 2 (Tables de vérité et formes normales (20 points)) 
Soit À = -x—yVz (ZA Y) = &. 


. Réécrivez cette formule sous forme d’arbre. (3 points) 
. Construisez la table de vérité de À. (5 points) 


. Déterminez une forme normale disjonctive de À et simplifiez-la le plus possible. (5 points) 


NN Lo D 


. Déterminez une forme normale conjonctive de À et simplifiez-la le plus possible. (5 points) 


5. Donnez un modèle et un contre-modèle de A. (2 points) 
Réponse: 
1. La formule stricte est A — (+ > (y Vz)= (-(zAy) = 2))). 


qui peut ensuite facilement être écrite sous forme d’arbre. 
2. La table de vérité est : 


ælylzl-x|yVzl-(yAz) |A 
010 0!1 0 1 1 
0011|1 1 1 0 
0110! 1 1 1 0 
0f111|1 1 (0 1 
11010!0 0 1 1 
1101110 1 1 1 
1111010 1 1 1 
1111110 1 0 1 


3. La FND est x + ÿ.7 + y.2 
4. La FNC est (x+y+2)(x+ÿ+2) 


5. Des modèles et contre-modèles se lisent facilement dans la table de vérité et/ou sur les formes normales. 


Exercice 3 (Résolution (25 points)) 
Soient 


F=-(-pA-qA-r)A(-pVaVr) 
et 
G=qVvr 
Dans tout cet exercice, les seules équivalences remarquables autorisées sont la distributivité 
et les lois de De Morgan. En particulier, il est interdit d'utiliser les règles de simplification. 
1. Transformez F et G en produit de clauses. 
Si nécessaire dans la suite de l'exercice, vous pourrez également calculer les clauses pour -F et/ou -G. 


2. Parmi les propriétés suivantes, dites lesquelles sont vérifiées, et justifiez vos réponses en utilisant la 
résolution et les lois de De Morgan : 


(a) FEG 
(b) GEF 
(ce) F=G 


(d) -F V Gest une tautologie. 
(e) -FV G est une contradiction. 


Réponse: Considérons les clauses correspondant aux formules F'et G : 
Fe={(p+q+r) (p+a+r)} 
Ge = {q sn r} 
1. F = G'si et seulement si FU -G'est insatisfaisable, ie permet de démontrer l’absurde par résolution. 


FÜU-G={(p+q+r),(p+qg+r),-q,-r} 


1. p+q+r Hypothse 
2. p+q+r Hypothse 
3 q+r Resolvant de 1.2. 
A. —q Hypothse 
5. Tr Resolvant de 3.4. 
6. —r Hypothse 
ts LL Resolvant de 5.6. 


2. Comme à la question précédente avec GU-F 


GeU-F={q+r,p+p+T,q+p,9q+TD+TG+TT} 


+r  Hypothse 
Hypothse 
Resolvant de 1.2. 
Hypothse 
Resolvant de 3.4. 


QUE RENE 
als ie 


3. F = G puisque FKGe&GEKF. 
4. -F V Gest une tautologie puisque F = G (loi du tiers exclus). 


5. -F V G n’est pas une contradiction puisque c’est une tautologie. 


Exercice 4 (DPLL (20 points)) 
Déterminez en appliquant l’algorithme DPLL si les ensembles de clauses suivants sont satisfaisables. Le 


cas échéant, vous donnerez le modèle exhibé par DPLL. 
Vous donnerez une trace complète du déroulement de l’algorithme étiquetée par les règles utilisées. 


1. {a+b+c, a+c+d, et+ta+b, ëtc+e, b+c, b+d, a+c, c+d} (10 points) 
2. {a+d, a+b+c+d, a+b+c+d, a+b+c+d, a+c, b+a+c, c+b, d+a} (10 points) 
Réponse: 
1. {a+b+c, a+c+d, e+a+b, tc+e, b+c, b+d, a+c, c+d} 
RED : {ä+c+d, e+a+b, b+c, b+d, a+c, c+d 


ElLle=1:{a+c+d, b+c, b+d, a+c, c+d} 
ELla=0:{b+c, b+d, c+d} 
Branche b = 0 : {£, c+d} 


ELI d = 0 : {t} 
ELI c=0:{} 
On a un modèle a —=0,b=0,c=0,d=0,e-=1 
2. {a+d, a+b d, a+b+c+d, b ,a+c, b+a+c, c+b, d+a} 


ü d,Ja+b+c+d,a 
{a+d, a+b+c+d, a+b+c+d, a+b+c+d, a+c, b+a+c, c+b, d+a} 
— Branche a = 0: {d, b+c+d, b b+c, © 
RU d=1:{b+c, b+c, b+c, c+b} 
— Branche b = 0: {c, c} 
RU : L 


RU : L 
— Branche a=1:{b+c+d, c, c+b, d} 
RU c=1,d= 0: {b, b} 
RU : L 
L'ensemble de clauses est insatisfaisable. 


Exercice 5 (Déduction naturelle (20 points)) 
Prouver, par déduction naturelle, les formules suivantes. 
Chaque formule de la preuve devra être justifiée ; il vous est recommandé de présenter vos preuves sous forme 


de tableaux comme vu en cours. 


1. À (pVa=sAt)=(qg—>s) (10 points) 
2. B = (pV-9 + ((p-=(a=r)) (10 points) 
Réponse: 


1. À (pVa—=sAt) => (q—s) 


1 assume p + q => s & t. 

2 assume q. 

3 p+q. +12 2 

4 s & t. =>E 1,3 

5 s. &E1 4 

6 therefore q => s. =>I 2,5 

7 therefore (p + q => s & t) => q => s. =>I 1,6 
2. B = (pV-9) =((p=-9)={(a=r)) 

1 assume p + -q. 

2 assume p => -q. 

3 assume q. 

4 assume P. 

5 -q. =>E 2,4 

6 F. =>E 5,3 

7 É: Efq 6 

8 therefore p => r. =>I 4,7 

9 assume -q. 


10 F. =>E 9,3 


11 L. Efq 10 

12 therefore -q => r. =>I 9,11 
13 r. +ES 1,8,12 
14 therefore q => r. =>I 3,13 
15 therefore (p => -q) => q => r. =>I 2,14 
16 therefore p + -q => (p => -q) => q => r. =>I 1,15 


Exercice 6 (Démonstration par récurrence, exo du poly (15 points)) 

Démontrez que toute formule construite avec une seule variable p, uniquement les connecteurs binaires V et 
A et sans négation est équivalente à une formule de taille 0. 

Si vous trouvez des cas très semblables, vous pouvez raccourcir la démonstration en admettant une partie 
d’entre eux. 
Réponse: Nous effectuons une preuve par récurrence sur la taille des formules. Considérons une formule F 
construite avec une seule variable p, uniquement V et A et sans négation. 


Cas de base : |F| = 0. La récurrence est trivialement vérifiée dans ce cas. 


Induction : |F} = n +1 et supposons que toutes les formules construite avec une seule variable p, unique- 
ment V et À et sans négation de taille inférieure ou égale à n sont équivalentes à une formule de taille O. 
Nous avons deux cas duaux, où |A] < n et |B] < n, donc par hypothèse de récurrence À et B sont donc 
équivalentes à une formule de taille 0, c’est-à-dire 0, 1, ou p : 

— F=(AVB). Nous avons donc 9 cas à examiner : 

— A=0 

— B=0, donc F = 0. 

— B=1, donc F =1. 

— B = p, donc F = p. 
— ÀA=1 

— B=0, donc F=1. 

— B=1, donc F —1. 

— B = p, donc F = 1. 
— A=p 

— B=0, donc F = p. 

— B=1, donc F = 1. 

— B=p, donc F = p. 

— F=(AAB). Nous avons donc 9 cas à examiner : 

— A=0 

— B=0, donc F = 0. 

— B=1, donc F =0. 

— B=p, donc F =0. 
— ÀA=1 

— B=0, donc F =0. 

— B=1, donc F = 1. 

— B = p, donc F = p. 
— A=p 

— B=0, donc F = 0. 

— B=1, donc F = p. 

— B=p, donc F = p. 


Examen INF402 


Frédéric Prost Benjamin Wack 


16 mai 2023 
2 pages 
Total : 120 points (noté sur 100) 
Durée : 2h00 


Documents autorisés : une feuille recto verso de notes manuscrites format A4. 

Le barème est indicatif, les points correspondent au nombre de minutes nécessaires pour réaliser les exercices. 
L'épreuve sera notée sur 100 points (total divisé par 5), il est donc possible de faire l’impasse sur 
un des exercices sans pénalité. 

Le résultat d’une question peut être admis pour s’en servir dans la suite de l’énoncé. Les exercices peuvent être 
traités dans l’ordre de votre choix à condition de les numéroter clairement. 


Exercice 1 (Formalisation (20 points)). 

Nous considérons la signature È = {animal"!, plante'!, mange"?, pluspetit"?}. 

1. (12 points)  Exprimer en logique du premier ordre et en utilisant la signature Y les phrases suivantes : 
(a) Il existe des animaux qui mangent à la fois des plantes et des animaux. 
(b) Aucune plante ne mange d'animal. 
(c) Tous les animaux mangent soit toutes les plantes, soit certains animaux plus petits qu'eux. 
(d) Les animaux qui mangent d’autres animaux mangent tous les animaux plus petits qu'eux. 

2. (8 points) ÆExprimer en français les propositions logiques suivantes : 
(a) Vx-(animal(x) & plante(x)) 
(b) Ax(plante(x) À Vy(plante(y) À x Æ y = pluspetit(y, x)) 


(c) xAy(animal(x) À animal(y) À mange(x, y) A Vz(mange(x, z) = y = 2)) 


Exercice 2 (Expansions (20 points)). 
À l’aide de la méthode des expansions, déterminer un contre-modèle de chacune de ces formules : 


1. (Oo points) A= (VrQ(x) — VrP(x)) — Vr(Q(x) — P(x)). 
2. (10 points) B = Vrdy((x =y) — P(x,y)) — VaVy(P(x,y) — (x =y)). 


Exercice 3 (Unification (15 points)). 
Pour chacune des équations suivantes, déterminez si elle admet une solution, et si oui déterminez un unificateur 
le plus général. Vous utiliserez pour cela l’algorithme du cours dont vous détaillerez les étapes en donnant à 
chaque fois le nom des règles utilisées. 

a et b sont des constantes ; f, g et h sont des fonctions. 


1. (5 points) Fa f(u,x)) F(F(y, a), JG, f(b, z))) 
2. (5 points) h(2, f{(y,g(a,x))) on h(f(b, b), fe, g(x, h(x, x)))) 
3. (5 points) F(R(g(a; z), g(2, z)),g(z, z)) T F(A(y, y), y) 


Exercice 4 (Skolémisation (15 points)). 
Soit À la formule suivante : A — (BaVvQ (x, y) AVz(Q(x,x) = yR(y,2)) ) = JyixR(x, y) 


Montrez que À est valide en montrant que — À est contradictoire par la méthode de Herbrand, en suivant les 
étapes suivantes : 


1. (10 points)  Skolémisez — À puis mettez-la en forme clausale. 


2. (5 points) Proposez des instances contradictoires des clauses obtenues et montrez la contradiction par 
résolution propositionnelle. 


Exercice 5 (Résolution (10 points)). 
Considérons l’ensemble suivant de clauses du premier ordre : 


P' = {P(x) + P(f(a)) + Q(y), P(y), Pb, x)) + Q(b), P((x)) + Q(x)} 


Nous voulons montrer que cet ensemble de clauses est insatisfaisable par instanciation ou par résolution. 
Au choix : (vous n'obtiendrez pas le double de points en utilisant les deux méthodes) 
1. (10 points) Trouvez des instances contradictoires de ces clauses et montrez par résolution propositionnelle 
que ces instances sont contradictoires. 


OU 


2. (10 points) Donnez une preuve directe du caractère contradictoire de T par factorisation, copie et résolution 
binaire. Il est possible que toutes les règles ne soient pas utilisées. 


Exercice 6 (Déduction naturelle (20 points)). 

Démontrez les formules suivantes en déduction naturelle au premier ordre. Comme vu en cours et en TD, on 
numérotera les lignes de la preuve, et on indiquera pour chaque ligne la formule démontrée, le contexte, la règle 
appliquée et les prémisses utilisées. 


1. Vyax-Q(x,y) = —-VrVyQ(x, y) 
2. VaVy(P(x) A -P(y) = x £ y) 


Exercice 7 (Ensemble complet et incomplet de connecteurs, exercice du poly (20 points)). 

Un ensemble de constantes et de connecteurs est dit complet, si toute fonction booléenne est exprimable avec 
ces constantes et ces connecteurs. Nous avons notamment vu en cours un théorème qui exprime que l’ensemble 
{L,T,-,V,A} est complet. 

1. Soit | l'opération suivante : x | y est vrai si et seulement si ni l’un, ni l’autre ne sont vrais, autrement 
dit x | y = 1 si et seulement si x = 0 et y — 0. Cette opération est aussi appelée ni car x | y est vrai si 
et seulement si ni x, ni y ne sont vrais. 

Montrer que cette opération (seule !) est complète. 

2. Montrer que l’ensemble {T,=} est incomplet. 

Indication : on pourra montrer que toute formule construite uniquement avec T et = prend la valeur 
1 quand toutes ses variables prennent la valeur 1. On en déduira alors assez facilement une fonction 
booléenne qui ne peut pas être exprimée avec cet ensemble. 


Corrigés 


Exercice 1, page 1 


Jrdyz(animal(x) À plante(y) À animal(z) À mange(x, y) À mange(x, z)) 
. Vx(plante(x) = Vy(animal(y) = -mange(x, y))) 


. Vx(animal(x) = Vy(plante(y) = mange(x, y)) V Ay(animal(y) À pluspetit(y, x) À mange(x, y))) 


. Vx(animal(x) À 3y(animal(y) À mange(x, y)) = Vz(animal(z) À pluspetit(z, x) = mange(x, z)) 
. Tout être est soit une plante soit un animal, mais jamais les deux à la fois. 


. Il existe une plante plus grande que toutes les autres. 


NO ® Où ER & ND 


. Il existe un animal qui ne mange qu’une seule espèce d’animal. 


Exercice 2, page 1 


1. La 1-expansion est valide : (Q(0) — P(0)) — (Q(0) — P(0)) 
La 2-expansion est : (Q(0).Q(1) —+ P(0).P(1)) — (Q(0) — P(0))(Q(1) — P(1)) Un contre 
modèle est Qr = {0} et Pr = {1} ou Ÿ (on a un contre modèle symétrique avec Qr={1}). 
2. La l-expansion est valide : ((0 = 0) —+ P(0,0)) —+ (P(0,0) —+ 0 = 0) pour toutes les 
interprétations de P. 
La 2-expansion est : 
((UÜ—0) — P(0,0))+((0=1) — P(0, 
((1=0) = P(L0))+((1=1) — P(, 
(P(0,1) — 0=1)(P(1,1) — 1=1) 
Un contre modèle est donnée par l'interprétation Pr = {(0,1),(1,0)} (ou contenant un de ces deux 
couples). 


)) — (P(0,0) — 0 = 0).(P(1,0) —+ 1 = 0). 


Exercice 3, page 1 


1. Utilisation de décomposition : (1)x = f(y, a), 
Elimination de (1) dans (3) donne (4) f(y, a) = f(b, 2). 
Utilisation de décomposition sur (4) donne (5) y = b, ( 
on élimine z dans (2) en utilisant (6). 

On trouve o = {x := f(b,a),y:= b,u:= a,2:= a}. 

2. Utilisation de décomposition : (1) z = f(b,b), (2) f(y,g(a,x)) = f(z,g(x, h(x,x))). 
Décomposition de (2) donne (3)y = z, (4) g(a,x) = g(x, h(x,x)). 

Décomposition de (4) donne (5)x = a, (6) x = h(x,x). 


H 
FPS 


Échec d'élimination en (6) l'algorithme s’arrête pas d’unification possible. 
3. Utilisation de décomposition : (1)h(g(a, x), g(z,z)) = h(y,y), (2)y = g(z, 2). 

Décomposition de (1) donne (3)g(a,x) = y et (4)y = g(z,2). 

On peut supprimer (4) qui est la même équation que (2). 

On élimine y dans (3) avec (2) ce qui donne (5)g(z, 2) = g(a, x). 

Décomposition de (5) donne (6) z = a et (7) z = x. 


On trouve o = {z:=a,x:= a,y = g(a,a)}. 


Exercice 4, page 2 


1. 


A = 2 


aVyQ (x, y) A Vr(-Q(x,x) V 3yR(y, 


x)) À -yIrR(x, y) 


Forme normale : rVyQ(x, y) À Vr(-Q(x,x) V yR(y, x)) À VyWæ-R(x, y) 
Forme propre : AVyQ(æ, y) À Vz(-Q(z, 2) V AR(t, 2)) À VuVu-R(v,u) 
Élimination des 1 : VyQ(a, y) À V2(-Q(2, 2) V R(F(2), 2)) À VuVu-R(v,u) 


Q(z; 
Élimination des V : Vyvavuvu(Q (a, y) À (= 
— Forme clausale : Q(a,y), Q(z,2) + R(f(2), 


. On instancie y := a,z:= a,v:= f(a),u := a. 


Alors Q(a, a) et Q(a,a)+ R(f(a), 


Exercice 5, page 2 
— On effectue {x := f(a),y := b} dans P(x) + P(f(a)) + Q(y) ce qui donne P(f(a)) + Q(b) on applique la 

résolution avec P(y) instanciée avec {y := f(a)} ce qui donne la résolvante (1) Q(b). 

On fait une autre instance de P(y) avec {y := g(b, a)} ce qui donne P(g(b, a)). En instantiant P(g(b, x)), Q(b) 

avec {x := a} on obtient P(g(b, a)), Q(b). En appliquant la résolution à ces deux instantiations on obtient 

(2) Q(b). 

On conclut en faisant une résolution sur (1) et (2) qui donne la clause vide. 

— Par factorisation de P(x) + P(f(a)) + Q(y) on obtient P(f(a)) + Q(y). Par résolution propositionnelle 


avec P(y) on obtient Q(y). Par résolution propositionnelle entre P(y) et P(g(b,x)) + Q(b) on obtient 
Q(b) avec une dernière résolution propositionnelle entre Q{y) et Q(b) on trouve la clause vide. 


Exercice 6, page 2 


1. (10 points) Vy= 


contexte | numéro | preuve justification 
1 1 Supposons Vydx-Q(x, y) 
1,2 2 Supposons VrVyQ(x, y) 
1,2 3 Ax-Q(x, y) VEy 2 
1,2,4 4 Supposons —Q(x,y) 
1,2,4 5 VyQ(x, y) VEx 4 
1,2,4 6 Q(x, y) VEy 5 
1,2,4 7 " 5 E 4,6 
1,2 8 Donc —Q(x,y) = L = 14,7 
1,2 9 JL 1E 3,8 
10 Donc —VaVyQ(x, y) = 12,9 
11 Donc Vydr-Q(x, y) = -VaVyQ(x, y) | = T1, 10 
2. (10 points)  VaVy(P(x) À -P(y) = x £ y) 
contexte | numéro | preuve justification 
1 1 Supposons P(x) A -P(y) 
1,2 2 Supposons ? = y 
1,2 3 P{x) AEI I 
1,2 1 = P(y) AE2 1 
1,2 5 P(y) cong 2,3 
1,2 6 de 5 E 45 
1 7 Doncr {y = I 2,6 
8 Donc P(x)A-P(y) = x £y 11,7 
9 Vy(P(x) A =P(y) = x £ y) VI 8 
10 VaVy(P(x) A -P(y) = x £ y) | VI9 


zQ(x,y) = -VaVyQ(x, y) 


Q(2,2) V R(J(2),2)) À -R(v,u)) 


z), R(v,u) 


a) ont pour résolvant R(f(a),a) qui est contradictoire avec R(f(a), a). 


Exercice 7, page 2 


1. Montrons que |, définie par x | y = 1 si et seulement si x — 0 et y = 0, est complète. 
Les connecteurs {-, L,V,A} sont définissables à l’aide de | : 
— —x=x|x 
L=-x|xz=(x|x)| 
zVy=z|y=(x|y)|(x|y) 
TAy=T|ÿ=(x|x)|(v|y) 
— enfin on exprime T comme 1 = {((x|x)|x)|((x|x)|x) 


z 
| 


2. Montrons que l’ensemble {1,—} est incomplet. 
Appelons stable pour 1, une fonction booléenne qui prend la valeur 1 quand tous ses arguments ont la 
valeur 1. 
Il est facile de voir que toute fonction booléenne définie avec les seules opérations {1,—} est stable pour 
1, car 1 = 1 = 1 (on peut le faire proprement par récurrence sur la taille de la formule). 
Or - n’est pas stable pour 1, donc la fonction f(x) = -x n’est pas exprimable. 
Par suite cet ensemble est incomplet. 
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Le barème est indicatif, les points correspondent au nombre de minutes nécessaires pour réaliser les exercices. 
L'épreuve sera notée sur 120 points + 5 points de bonus. 

Le résultat d’une question peut être admis pour s’en servir dans la suite de l’énoncé. Les exercices peuvent être 
traités dans l’ordre de votre choix à condition de les numéroter clairement. 


Exercice 1 (Modèles et formes normales (25 points)) 
Soit A=aV-c& d=bAdV-a b. 


1. Réécrivez cette formule sous forme d’arbre. (3 points) 

2. Déterminer une forme normale disjonctive de A et la simplifier le plus possible. (9 points) 

3. Déterminer une forme normale conjonctive de À et la simplifier le plus possible. (9 points) 

4. Si c’est possible, donner un modèle de A et justifier la réponse sans utiliser de table de vérité. 
(2 points) 

5. Si c’est possible, donner un contre-modèle de À et justifier la réponse sans utiliser de table de vérité. 
(2 points) 

Réponse: 


— Je donne À sous sa forme stricte : (a V —c) & (d = (((b A d) V -a) = b)). 


—— En forme normale disjonctive : a + c.d.b + &.d + &.b 
Ce qui donne 4 modèles : (1) a = 0, (2) b=0,c=d=1,(3)c=d=0,(4)b=1,c=0 
— En forme normale conjonctive : (a+ &+ d).(a+&+b).(a+c+d+b 
Ce qui donne 3 contre-modèles : (1) a=d=0,c=1,(2)a=0,b=c=0,(3)a=b=c=0,d=1 


Exercice 2 (Formalisation (Exo du poly, 15 points)) 
Formaliser les énoncés suivants en logique propositionnelle : 


(a) Si Pierre est rentré chez lui, alors Jean est allé au cinéma. 

(b) Marie est à la bibliothèque ou Pierre est rentré chez lui. 

(c) Si Jean est allé au cinéma, alors Marie est à la bibliothèque ou Pierre est rentré chez lui. 
(d) Marie n’est pas à la bibliothèque et Jean est allé au cinéma. 

(e) Pierre est rentré chez lui. 


À l’aide d’une des méthodes vues en cours (au choix), déterminer si le dernier énoncé (e) est conséquence des 
énoncés (a) (b) (c) et (d). 

Réponse: Les faits, Pierre est rentré chez lui, Jean est allé au cinéma, Marie est à la bibliothèque sont dénotés 
respectivement par les variables p, j, m. Les hypothèses sont formalisées par les formules : 


1. p= 3j. 
2. m V p. 
3j mVp. 


4. —m A j. 


Et la conclusion par p. 
En utilisant les équivalences remarquables, nous prouvons que (p = j)A(mVp)A(j = mVp)A(-mAj)A-p 
est contradictoire. Car en enlevant les implications nous avons : 


CpVi)A(mVp)A (3j V mVp) Am AA pr. 
En utilisant (x V -y) À y = x À y, entre la seconde et la quatrième clause nous obtenons : 
CpVj)ApA(SV MVP) Am AA pr. 


Nous obtenons une contradiction entre p et -p. Et donc le raisonnement est correct. 


Exercice 3 (Résolution (20 points)) 
Montrez par résolution que les ensembles de formules suivants sont insatisfaisables : 


1. {a+ä&ca+b+d+e,b+d,e+b,f +g,g+ f,f +e} (10 points) 
2. {j+m,q+m+rq+im+rp+r,p+T,p+a} (10 points) 


Réponse: 


+c Hyp 


a 
c Hyp 

a Résolvant de 1, 2 
a 

b 


d+e Hyp 


b 
d+e Résolvant de 3, 4 
b+d Hyp 
e Résolvant de 5, 6 
b Hyp 
Résolvant 7,8 
g Hyp 
Le Hyp 
Résolvant de 10,11 
Hyp 
Résolvant de 12,13 
Résolvant de 9,14 


D IDE XX ND H 


J 
T 
Q 


_ 
ND 
USSR OS D 


Hyp 

Hyp 

Résolvant de 1, 2 
Hyp 
Résolvant de 3, 4 
Hyp 
Résolvant de 5, 6 
Hyp 
Hyp 
Résolvant de 8,9 
Résolvant de 7,10 


S 7 


sas 


J 
T 
Q 


Il 
T 
3 


ñ 
T 
»! 


RE © © Oo CE À ND H 


FR © 


Si SI S TS Qi Qi Qi Qi RQ) 


Exercice 4 (DPLL (20 points)) 


Déterminez en appliquant l’algorithme DPLL 5i les ensembles de clauses suivants sont satisfaisables. Le 
cas échéant, vous donnerez le modèle exhibé par DPLL. 


Vous donnerez une trace complète du déroulement de l’algorithme étiquetée par les règles utilisées. 


1. {a+b+c+d+f,a+b,b+a,c+d,d+c}. (10 points) 
2. (p+a+T r+a+p, p+tr+o T+0 g+p, P+Q T+p, q+s, 5+p} (10 points) 
Réponse: 
1. a+b+c+d+f,a+b,b+a.c+dd+c 
BuI ÿ=1| 
ä+b,b+a,c+d,d+c 
a = 0 a = 1 
b,c+d,d+c b,c+d,d+c 
ELI b=0 
c+d,d+e 
c=0 c=1l 
d d 
PLI 4-0 
() 


D'après la trace ci-dessus, l’ensemble est satisfaisable. Nous observerons que, d’après le sens de « ou 
alors », l’algorithme se termine sur la première feuille, où la valeur vrai est retourné. Un modèle est donc 
d=0,c=1,b=0,a 


0, et f = 1. 


2. p+q+rr+q+pp+r+qr+aqq+pp+qq+pq+s,s+p 
| RD 
r+q,q+p,p+qq+pq+s,s+p 
Eu r=l 
g+p,p+qq+pq+s,sS+p 
p=—0 p=1 
q4q+s qq+s,s 
m| RU 
L 


Exercice 5 (Déduction naturelle (25 points)) 
Prouver, par déduction naturelle, les formules suivantes. 


Chaque formule de la preuve devra être justifiée ; il vous est recommandé de présenter vos preuves sous forme 
de tableaux comme vu en cours. 


1. ((pVa)=r)=(p=r) (5 points) 
2. (p=æ-p)A(p=p)=1L (10 points) 


3 p=(-pVq)= 9 (10 points) 
Réponse: 


LGV) er) ET) 
1 assume (p + qd) => r. 
2 assume P. 
3 p + q. +11 2 
r. =>E 1,3 
5 therefore p => r. =>I 2,4 
6 therefore ((p + q) => r) => (p => r). =>I 1,5 
2. (=> p)ACp>p)>1 
1 assume (p => -p) & (-p => p). 
2 Pp => -P. &E1 1 
3 -p => p. &E2 1 
4 assume P. 
5 -P. =>E 2,4 
6 F. =>E 5,4 
7 therefore -p. =>I 4,6 
8 p. =>E 3,7 
9 F. =>E 7,8 
10 therefore (p => -p) & (-p => p) =>F. =>I 1,9 
3 p>(pVa)= a 
1 assume Pp. 
2 assume -p + q. 
3 assume -P. 
4 F. =2>E 3,1 
5 q. Efq 4 
6 therefore -p => q. =>I 3,5 
7 assume q. 
8 therefore q => q. =>I 7,7 
9 q. +E 2,6,8 
10 therefore -p + q => q. =>I 2,9 
11 therefore p => -p + q => q. =>I 1,10 


Exercice 6 (Démonstration par récurrence (20 points)) 

Démontrer que toute formule stricte construite uniquement avec : 

— la constante T, 

— la variable propositionnelle x, 

— les connecteurs = et V, 

— et les parenthèses 

équivalente soit à x soit à T. 

Réponse: Par récurrence sur la taille de la formule. 
Une formule de taille 0 est nécessairement une variable ou une constante, donc en l’occurrence x ou T. 
Soit un entier n > 0, supposons la propriété vraie pour toute formule de taille strictement inférieure à n. 

Soit alors À une formule de taille n de la forme décrite dans l’énoncé. À est forcément de la forme B = C ou 

bien B VC, où B et C sont des formules de taille strictement inférieure à n, toutes deux construites comme À. 
Par hypothèse de récurrence, B et C' sont toutes deux équivalentes à x ou T, on est donc ramené à étudier 

8 cas : 
— A=zzx>x=T 

== 

=T>x=7xr 

FR T=T 

TVXT=X 

[ Væx= T et de même pour æVTetTVT 


H 


es 


| 
bbbb} 
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Le barème est indicatif, les points correspondent au nombre de minutes nécessaires pour réaliser les exercices. 
L'épreuve sera notée sur 120 points. 

Le résultat d’une question peut être admis pour s’en servir dans la suite de l’énoncé. Les exercices peuvent être 
traités dans l’ordre de votre choix à condition de les numéroter clairement. 


Exercice 1 (Expansions (20 points)). 
À l’aide de la méthode des expansions, déterminer un contre-modèle de chacune de ces formules : 


(PC) > Vy(P(y) = x = y)). 
2. (10 points) B = VrlyR(x, y) = 2yVxR(x, y). 


LI 


1. (10 points) À = 


Exercice 2 (Formalisation (20 points, exercice du poly)). 
Nous considérons 2 = {f"2,0"?, c"?, j"2,rf0,pf1} la signature ayant la sémantique donnée ci-dessous. 
— f(x,y) : x est un frère de y. 

— o(x,y) : x est un oncle de y. 

— cx,y) : x est un cousin de y. 

— j(x,y) : x est plus jeune que y. 

— r est le diminutif de Robert. 

— p(x) est le père de x. 

1. (12points) ÆExprimer en logique du premier ordre et en utilisant la signature Y les phrases suivantes : 
(a) Tout frère du père de Robert est un oncle de Robert. 
(b) Si les pères de deux enfants sont des frères alors ces deux enfants sont des cousins. 
(c) Robert a un cousin plus jeune qu’un des frères de Robert. 


2. (8 points) ÆExprimer en français les propositions logiques suivantes : 


(a) 3x j(p(x), 2) 


(b) VaVy(p(p(x)) = p(p(y)) = c(x, y)) 
(c) Vaay(f(x, y) À (x, y)) 
(d) 2x2y(f(x, y) A —(p(x) = p(y))) 


Exercice 3 (Unification (15 points)). 
Pour chacune des équations suivantes, déterminez si elle admet une solution, et si oui déterminez un unificateur 
le plus général. Vous utiliserez pour cela l’algorithme du cours dont vous détaillerez les étapes en donnant à 
chaque fois le nom des règles utilisées. 

a et b sont des constantes ; f, g et h sont des fonctions. 


,b) 
= f(z,x,h(b,b)) 
.h(g(z),2)) 


1. (5points) f(x, g(a),x) = f(y, g(y 
2. (5 points) IP, VU, a), g(y): h(y, b 
3. (5 points) A(g(x), h(y,x)) = h(g(y 


Exercice 4 (Skolémisation (15 points)). 
Soit À la formule suivante : -VxP(x) V -VrxQ(x) = -(VzP(x) À VrQ(x)) 
Montrez que À est valide en montrant que — À est contradictoire par la méthode de Herbrand, en suivant les 
étapes suivantes : 
Î. (10 points)  Skolémisez — À puis mettez-la en forme clausale. 
2. (5 points) Proposez des instances contradictoires des clauses obtenues et montrez la contradiction par 
résolution propositionnelle. 


Exercice 5 (Résolution (15 points)). 
Considérons l’ensemble suivant de clauses du premier ordre : 


T = {C(x,y)+E(z,x) + E(z,y), C(c,a), C(a,b), C(c,b), C(x,y) + E(x,x), C(x,y) + E(x,y)} 


Nous voulons montrer que cet ensemble de clauses est insatisfaisable par instanciation et par résolution. 


Î. (Tpoints) Trouvez des instances contradictoires de ces clauses et montrez par résolution propositionnelle 
que ces instances sont contradictoires. 


2. (8points) Donnez une preuve directe du caractère contradictoire de T par factorisation, copie et résolution 
binaire. Il est possible que toutes les règles ne soient pas utilisées. 


Exercice 6 (Déduction naturelle (20 points)). 

Démontrez les formules suivantes en déduction naturelle au premier ordre. Comme vu en cours et en TD, on 
numérotera les lignes de la preuve, et on indiquera pour chaque ligne la formule démontrée, le contexte, la règle 
appliquée et les prémisses utilisées. 


1. (10 points) —21x(P(x) V Q(x)) = Vr(-P(x) À -Q(x)) 
2. (10 points) Va Vy(A2(x = z A 2 = y) = (x = y)) 


Exercice 7 (Démonstration par récurrence (15 points)). 
Soit n un entier positif non nul. Soient A1, A2,...A, et B des formules du premier ordre. 

On suppose que x1 est la seule variable libre dans A1, que x2 est la seule variable libre dans A2, etc. et que 
y est la seule variable libre dans B. 

On s'intéresse à la formule 24» An = ... = 27242 = 2x1 41 = VyB. 


1. (1 point)  Rappeler quelle est la formule stricte (parenthésée) correspondant à cette formule. 


2. (14 points) Démontrer que, pour tout n > 1, on a 


ln An > 4 2x9 A2 ce dti A: ce VyB = Van VaoVaiVy(An x A2 A; B) 


Corrigés 


Exercice 1, page 1 

1. La 1-expansion est valide : P(0) = (P(0) = 0 — 0) 

La 2-expansion est : 

= (P(0) = 0 =0).(P(I 
= (P() = L)) + (P( 


Ill 
TS 
ae 
Ps 
(ee) 
LES 


( 
= (P(0) = P(D))+ (P(1) + PO) 


Le (seul) contre-modèle est donc P; = {0,1}. 
2. La 1-expansion est valide : R(0,0) = R(0,0) 
La 2-expansion est : 
(R(0,0) + R(0, 1)).(R(L, 0) + R(1,1)) = R(0,0).R(L, 0) + R(0,1).R(1, 1). 
Les contre-modèles sont donc R; = {(0,0), (1,1)} et Rr = {(0,1), (1,0)}. 


Exercice 2, page 1 


1. Tout frère du père de Robert est un oncle de Robert : 
Va(f(æ,p(r)) = o(x,r)). 
2. Si les pères de deux enfants sont des frères alors ces deux enfants sont des cousins : 
VaVy(f(p(x),p(y)) = c(x, y). 


3. Robert a un cousin plus jeune qu’un des frères de Robert : 


dr(c(x,r) À Ay(F (ur) À 5, y))). 


. dx j(p(x),x) : personne n’est plus âgé que son père 
p(p(x)) = p{p(y)) = c(x, y)) : deux personnes qui ont le même grand-père paternel sont cousines 


j(x, y)) : tout le monde a un frère aîné (impossible mais ça n'empêche pas de l’exprimer.….) 


en IN 
< 
ü 
PR RAS 


—(p(x) = p(y))) : il y à deux frères qui n’ont pas le même père 


Exercice 3, page 1 


1. f(x, g(a),x) = (y, g(y),b) 
Décomposition : x = y, g(a) = g(y), x = b 
Élimination de x : x := y, g(a) = g(y), y =b 
Décomposition : x :=Yy,a=7y,y=b 
Élimination de y: ti=y,a=b,y:=b 
Échec de décomposition : pas de solution. 

2. f(f(æ, 9, a), g(u), A9, b)) = f(2,œ, k(6,b) 
Décomposition : f(x,y,a) = z, g(y) = x, h(y,b) = h(b,b) 
Orientation (x2) : 2 = f(x,y,a), x = g(y), h(y,b) = h(b,b) 
Élimination de 2 : 2:= f(x,y,a), x = g(y), h(y,b) = h(b,b) 
Élimination de x : 2:= f(g(y),y,a), x := g(y), h(y,b) = h(b,b) 
Décomposition : z:= f(g(y),y,a), x := g(y), y =b, b=b 


Identité : z:=— f(g(y),y,a), x := g(y), y =<b 

Élimination de y : z:= f(g(b),b, a), x := g(b), y:=b 

<aæ:= g(b),y:= b,z:= f(g(b),b,a) > est une solution la plus générale de l’équation. 
3. h(g(x), (y, x)) = h(g(y), A(g 

Décomposition : g(x) = g(y),h 


ù 
— 
ù 


Décomposition : x = y, h(y,x) = h(g(z),2)) 
Élimination de x : x :—y, h( 
Décomposition : x := y, y = 
Élimination de y : x := y, y := g(z2), g(z) = 2 
Orientation : &:= y, y := g(2), z = g(z) 


Échec d'élimination de z : pas de solution. 


Exercice 4, page 2 
A = -(-VrP(x) V -VrQ(x) = -(VrxP(x) A VrQ(x))) 


1. Forme normale : (2x-P(x) V 37-Q(x)) A VxP(x) A VxQ(x)) 
2. Forme propre : (1x-P(x) V 3y-Q{(y)) A VuP(u) À VuQ(v)) 
3. Elimination des 1 : (-P(a) V -Q(b)) A VuP(u) A VuQ{(v)) 
4. Enlèvement des V : (-P(a) V -Q(b)) A P(u) A Q(v)) 

5. Forme clausale : {-P(a) V co ), P(u), Q(v)} 

6. Instances contradictoires : Fe )V -Q(b), P(a), Q(b) 

1: —P(a)V-Q(b) Hyp 

2: P(a) Hyp 

3: —Q(b) Res 1,2 

4: Q(b) Hyp 

D: JL Res 3,4 


Exercice 5, page 2 


Instanciation : Nous obtenons les instances contradictoires suivantes : 


T = {C(c,a) +El(c,c) + E(c,a),C(a,b) + Elc,a) + E(c,b), (deux instances) 
C(c,a), C(a,b), C(c,b), E(c, c) + C(c,b), E(c, b) + C(c,b)} 


Par résolution propositionnelle nous avons la preuve : 


(1)  C(c,b) Hyp 

(2)  Ecc)+C(c,b) Hyp 

(3) Ec,b) +C(c,b) Hyp 

(4) Ec,c) Res 1,2 
(5)  Ec,b) Res 1,3 
(6) C(ca)+E(c,c)+El(c,a) Hyp 

(7)  C(a,b)+El(c,a)+Elc,b) Hyp 

(8) C(c,a) + E(c,a) Res 4,6 
(9)  C(a,b) + Elc,a) Res 5,7 
(10) C(c,a) + C(a,b) Res 8,9 
(11) C(c,a) Hyp 

(12) C(a,b) Res 10,11 
(13) C(a,b) Hyp 

(4) L Résolvant 12,13 


Résolution binaire : 


numéro conclusion justification unificateur 
(1) C(c, b) Hyp 
(2) E(x;x) + C(x,y) Hyp 
(3) E(x, y) T C(x, y Hyp 
(4) E(c, c) Res 1,2 <æri=cyi=b> 
(5) E(c, b) Res 1,3 <xi=cyi=b> 
6) Cay+Eo+E24) Hp 
(7) C(c, y) + E(c, y) Res 4,6 <Zi=c2:=c}> 
(8) C(x,b) + E(c, x) Res 5,6 <y:=b,z=c> 
(9) C(c, y) + C(y, b) Res 7,8 <t=y}> 
(10) C{c, a) Hyp 
(11) C(a, b) Res 9,10 <y:=a> 
(12) C(a,b) Hyp 
(13) de Résolvant 11,12 
Exercice 6, page 2 
1. 3 (P(x) V Q(a)) = Vr(-P(x) À -Q(x)) 
contexte | numéro | preuve justification 
1 1 Supposons —x(P(x) V Q(x)) 
1,2 2 Supposons P(x) 
1,2 3 P{x) V Q(x) VII 2 
1,2 4 Jr(P(x) V Q(x)) 313 x 
1,2 5 Ts sp 
1 6 Donc -P(x) = 12,5 
1,7 7 Supposons Q(x) 
17 3 P{x) V Q(x) VI27 
1,7 9 Jr(P(x) V Q(x)) 18 x 
17 10 Le DE, 
1 11 Donc -Q(x) = 17,10 
1 12 —P(x) À -Q(x) AT 6, 11 
1 13 Vx(-P(x) A -Q(x)) VI 12 
14 Donc ——x(P(x) V Q(x)) = Vx(-P(x) A -Q(x)) | = T1, 13 
2. VaWy(z(x = 21 z= y) = (x = y)) 
contexte | numéro | preuve règle 
1 1 Supposons d2(r = 2/12=—4y) 
1,2 2 Supposons (xt —2Az—71) 
1,2 3 T=2 FEI 2 
1,2 1 z=y AE2 2 
1,2 5 T =Y congruence 4,3 
1 6 Donc (x =212=y)=(x=7y) 1 2,5 
1 7 T=Y 3E 1,6 
8 Donc 1z(x =2A2z=y)— (x A7 
9 Vy(Az(x = 212=7y) = (x = y) VI 8 
10 VaVy(z(x = 2/Az= y) (x VI9 
3. 


Exercice 7, page 2 


|. (2.4, > Ca = (3 


x A9 = (3x1 A = wB))), 


2. Par récurrence (directe) sur n : 


— Pour n = 0 on a trivialement VyB = VyB 


— Supposons n > 1 et la propriété vraie 


inAn >... > 2249 = 1 A1 = VyB 


Or la formule 27,_14n_1 =... = 32 


pour n — 1. Alors : 


au 


7 


ty An) V ( 


(Vrn-An) V G 


En—1Ân—1 >... 1 


Ln—1AÀn—1 >... 1 


æ1 A: A VyB) 
æ1 A: A VyB) 


141 = VyB satisfait la propriété au rang n — 1 : 
= (Vin An) VV res Va Vy(An-1 > 4 À: ce B) 
Comme les variables ne sont pas libres dans les autres parties 
= VanVrn_1.. Va1Vy(-An VA... A > B)) 
= VanVarn-1... Va Vy(An = A1 


de la formule : 


A = B) 
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Le barème est indicatif, les points correspondent au nombre de minutes nécessaires pour réaliser les exercices. 
L'épreuve sera notée sur 120 points + 5 points de bonus. 

Le résultat d’une question peut être admis pour s’en servir dans la suite de l’énoncé. Les exercices peuvent être 
traités dans l’ordre de votre choix à condition de les numéroter clairement. 


Exercice 1 (Modèles et formes normales (20 points)) 
Soit A=aAd=bAc 1C d À à. 


1. Réécrivez cette formule sous forme d’arbre. (1 point) 

2. Déterminer une forme normale disjonctive de À et la simplifier le plus possible. (8 points) 
3. Déterminer une forme normale conjonctive de À et la simplifier le plus possible. (8 points) 
À. Si c’est possible, donner un modèle de A et justifier la réponse sans utiliser de table de vérité. 


(1,5 points) 


5. Si c’est possible, donner un contre-modèle de À et justifier la réponse sans utiliser de table de vérité. 
(1,5 points) 


Réponse: 
— Je donne À sous sa forme stricte : (((a A d) = (bAc)) & (-c= (-dAa))). 
— En forme normale disjonctive : a A =dVaAbVaA-cV-aAc 
Ce qui donne quatre modèles : (1) a=1,d=0,(2)a=1,b=1,(3)a=1,c=0et (4) a=0et c=1. 
— En forme normale conjonctive : (a V bV -cV -d) A(aV c) 
Ce qui donne deux contre-modèles : (1) a=—1,b=0,c=1,d=1et (2) a=0,c=0. 


Exercice 2 (Formalisation (25 points)) 


Nous retournons sur l’île des Purs et des Pires!. Rappelons que les Purs disent toujours la vérité tandis que 
les Pires mentent toujours. 


Nous rencontrons cette fois trois indigènes, Aha, Bébé et Sissi. Nous savons que l’un d’entre eux est Pur 
alors que les deux autres sont Pires. Ils affirment : 

Abha : «Il n’y a aucun danger sur cette île. » 

Bébé : « Aha est Pur. » 

Sissi : « Bébé est Pire. » 


Peut-on en conclure que l’île est dangereuse ? 


1. Formaliser les trois affirmations, la conclusion, et le fait qu'il y a un Pur et deux Pires. (10 points) 
Pour cela, vous utiliserez les variables propositionnelles suivantes : 
— À : Aha est Pur. 
— B : Bébé est Pur. 
— C': Sissi est Pur. 


1. Cette énigme est librement inspirée d’un problème de Jean-Claude Baillif et réutilise les personnages de Raymond Smullyan. 


— D: L'ile est dangereuse. 


2. Transformer chacune des trois affirmations, le fait qu’il y a un Pur et deux Pires, ainsi que la négation 
de la conclusion en un ensemble de clauses équivalentes. (10 points) 


3. Démontrer, par résolution, que la conclusion se déduit des trois affirmations. (5 points) 
Réponse: 
1. Affirmation de Aha : A& -D 
Affirmation de Bébé : B< A 
Affirmation de Sissi : C = -B 
Conclusion : D 


Tribus des personnages : par exemple AA-BA-C+-AA-BAC+-AABA-C 


2. Clauses : 
_ A+D, A+D 
BY AALE 
PO DEC 
D 


— A+B+C, A+B,B+C, A+ 


3. On n'utilise en fait que très peu de clauses, et Sissi ne nous apprend rien : 


1 -D hyp 
2 A+D hyp 
3 A res 1,2 
4 -A+B  hyp 
5 -A+-B hyp 
6 -A res 4,5 
7 Faux res 3,6 


Exercice 3 (Résolution (Exo du Poly, 20 points)) 
Les ensembles de formules suivants sont insatisfaisables. 
— {a+b,a+c,a+d,d+c,b+a}. 
— fa+b+ca+b,b+c,c+a.a+b+c}. 

En donner une preuve par résolution. 

Réponse: 


— Soit l’ensemble de clauses : {a + b,a + c,a + d,d+€,b + a}. Nous suggérons une tactique pour obtenir 
une preuve : construire en priorité les résolvants ayant le moins de littéraux possibles. 


T a+b Hyp 

2 b+a Hyp 

3 a Résolvant de 1, 2 
4 a+c  Hyp 

5 C Résolvant de 3, 4 
6 a+d Hyp 

TA Résolvant de 3, 6 
8 d+c Hyp 

9 d Résolvant de 5, 8 
10 L Résolvant de 7,9 

— Soit l’ensemble de clauses : {a+b+ca+b,b+c,c+a,a+b+c}. Nous utilisons la même tactique pour 


obtenir une preuve. 


1 a+b+c Hyp 

2 a+b Hyp 

3 b+c Résolvant de 1,2 
4 c+a Hyp 

5 b+c Résolvant de 2, 4 
6 b Résolvant de 3, 5 
7 b+c Hyp 

8 C Résolvant de 6, 7 
9 a Résolvant de 4, 8 
10 a+b+c Hyp 

11 b+c 9, 10 

12 © Résolvant de 6, 11 
13 L Résolvant de 8, 12 


Exercice 4 (DPLL (20 points)) 

Appliquer l'algorithme DPLL sur chacun des ensembles de clauses suivants. Vous donnerez la trace de l’algorithme 
sous forme arborescente en étiquetant clairement chaque étape par la règle utilisée et les assignations qui en 
découlent. Vous interpréterez clairement les résultats obtenus lorsque l'algorithme se termine et vous donnerez 
un modèle le cas échéant. 


1. {a+b+c, a+b, a+c a+c+d, a+c+d, a, & b+d} (5 points) 


2. {a+b+c+d+8+f, b+c, a+c+d+f, a+d+e, b+c+f, b+d+e, b+c, b+c+d, b+c+d, b+d, b+e, f} 
(15 points) 


Réponse: 


1. at-b+c, -a+b, -a+-c, a+t-c+-d, -at+c+-d, a, -c, -b+d 
RE 
-a+b, -a+c+-d, a, -c, -b+d 
RU a=1, c=0 
b, -d, -b+d 
RU b=1, d=0 


Faux 


2. atb+c+-d+-et-f, -b+c, at+tc+d+f, -a+-d+-e, -b+-c+-f, -b+-d+e, 
b+-c, b+-c+-d, b+c+d, b+-d, b+e, -f 


RE 

-b+c, a+c+d+f, -a+-d+-e, -b+-d+e, b+-c, b+c+d, b+-d, b+e, -f 
RU f=0 

-b+c, a+c+d, -a+-d+-e, -b+-d+te, b+-c, b+c+d, b+-d, b+e 
Branchement sur b 

1) b=0 


a+c+d, -a+t-d+-e, -c, c+d, -d, e 


RE 


-C, ctd, -d, e 


ELI e=1 

-C, c+d, -d 
RU c=0, d=0 
FAUX 

2) b=1 


c, atc+d, -a+-d+-e, -d+e 
RE 

c, -at-d+-e, -d+e 

ELI c=1 

-a+-d+-e, -d+e 

ELI a=0 

-d+e 

ELI d=0 


Vrai 


D'où, le modèle a =0,b=1,c=1,d=0, f = 0. 


Exercice 5 (Déduction naturelle (25 points)) 
Prouver, par déduction naturelle, les formules suivantes. Vous présenterez vos preuves sous forme de ta- 
bleaux. 


1. (C—=-B)A(A=B)=(C A) (10 points) 
2. AA(-AVB)=AAB (10 points) 
3. (-A 1B) = (B = À) (5 points) 


Réponse: 
1. (C-=-B)A(A=B)=(C À) 


assume (c => -b) & (a => b). 
assume c. 


assume a. 
c => -b. 
a => b. 


therefore -a. 
therefore c => -a. 
therefore (c => -b) & (a => b) => c => -a. 


2. ANA(-AVB)= AAB 


assume a & (-a + b). 
a. 
-a + b. 
assume -a. 
F. 
a & b. 
therefore -a => a & b. 
assume b. 
a & b. 
therefore b => a & b. 
a & b. 
therefore a & (-a + b) => a & b. 


3. ((A=-B)=(B= A) 


assume -a => -b. 


assume b. 
assume -a. 
-b. 
F. 
therefore --a. 


a. 
therefore b => a. 
therefore (-a => -b) => b => a. 


Exercice 6 (Démonstration par récurrence (15 points)) 
Dans tout cet exercice on note @ l'opérateur « ou exclusif », dont nous rappelons la table de vérité : 


— Démontrer que le connecteur ® est associatif, autrement dit que (r®y)®z = @(y®2). 
— Soient maintenant n variables différentes æ1...%». 
Démontrer par récurrence que pour toute assignation v, on a [x1 ® x2...@ tnlu = 1 st et seulement si le 
nombre de ces variables valant 1 dans v est impair. 
Réponse: 


— Par les tables de vérité, il apparaît clairement que les modèles de ces deux formules sont les mêmes : les 
assignations dans lesquelles une seule ou les trois variables valent 1. 
— Cas de base : Si n = 1, on à une seule variable et la propriété est trivialement vérifiée. On peut aussi 
commencer à n = 2 sans difficulté. 
Hypothèse de récurrence : Supposons que pour n > 1, on a [x ®...@æ%], — 1 si et seulement si le 
nombre de [x;], (4 allant de 1 à n) valant 1 est impair. 
Pas de récurrence Considérons n + 1 variables différentes : &1...æ»+1. 


On a 4 cas a étudier : 


1. [a1®...Dzxl, = 0 et [ty+1le = 0. Dans ce cas, [1 Tn+1]o = 080 = 0. Or, par hypothèse 
de récurrence, le nombre de [x:;], (à allant de 1 à n) valant 1 est pair, ce qui reste vrai pour à de 
1 à n +1 puisque [ry41le = 0. 


2. [1 D...Dxals = 0 et [tns1ly = 1. Dans ce cas, [x: Tn+1lv = 0®1= 1. Or, par hypothèse 
de récurrence, le nombre de [x;], (4 allant de 1 à n) valänt 1 est pair, et donc il devient impair 
pouridelàän+l. 


3. [t1®...Dxls = 1 et [tui1le — 0. Dans ce cas, [x1 ...Bæni1ls = 1@0 = 1. Or, par hypothèse 
de récurrence, le nombre de [x;], (à allant de 1 à n) valant 1 est impair, ce qui reste vrai pour à 
de1àn+l. 

4. [x: Tnlo = Let [tn+ile = 1. Dans ce cas, [x Tn+1lo = 1® 1 = 0. Or, par hypothèse 
de récurrence, le nombre de [x;], (4 allant de 1 à n) ‘abat 1 est impair, et donc il devient pair 


pouridelàän+l. 
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Le résultat d’une question peut être admis pour s’en servir dans la suite de l’énoncé. Les exercices peuvent être 
traités dans l’ordre de votre choix à condition de les numéroter clairement. 
Exercice 1 (Expansions (20 points)). 
1. (10 points) À l’aide de la méthode des expansions, déterminer un contre-modèle de la formule 
A = VaVy(R(x, y) À R(y,x) = R(x,x)). 


( 
2. (10 points) À l’aide de la méthode des expansions, déterminer un modèle de la formule 
B = Vay(P(x,y) A x À y). 


Exercice 2 (Formalisation (20 points, d’après un exercice de Christine Paulin)). 


On cherche à modéliser un plan de table, c’est-à-dire comment les personnes sont installées pour le repas. 
On utilisera les symboles suivants : 


— Voisin(x,y) signifie que x est assis à côté de y; 
— Ami(x,y) signifie que x et y sont amis ; 
— Femme(x) signifie que x est une femme. 
1. (15 points) À l’aide de ces symboles, exprimez par des formules du premier ordre les énoncés suivants : 
(a) Les personnes qui sont assises côte-à-côte sont toutes amies. 
(b) Deux hommes ne sont jamais assis côte-à-côte. 
(c) Chaque femme est assise à côté d’au moins un homme. 
(d) Personne n’est assis tout seul. 


(e) On ne peut pas être assis à côté de soi-même. 


(f) Personne n’est assis auprès de plus de deux personnes. 


2. (5 points) Soit le domaine D = {0,1,2,3,4}. On suppose que 3 et 4 sont les seules femmes. Tout le 
monde est ami avec tout le monde, sauf 0 et 3 qui se détestent. 


Proposez une interprétation de la relation Voisin qui donne un modèle de l’ensemble des formules 
précédentes. 


Exercice 3 (Unification (15 points)). 
Pour chacune des équations suivantes, déterminez si elle admet une solution, et si oui déterminez un unificateur 
le plus général. Vous utiliserez pour cela l’algorithme du cours dont vous détaillerez les étapes en donnant à 
chaque fois le nom des règles utilisées. 


1. (5 points) (a, g(x,b), f(y)) = h(x,g(a,y), f(y)) 
2. (5 points) h(x, y, g(x, b)) = h(y, z,g(f(z), b)) 
3. (5 points)  h(x,y,g(x,y)) = h(z,z2,g(g(a.b), f(a))) 


Exercice 4 (Skolémisation (15 points)). 

Soit À la formule suivante : Vx(Q(x) = R(x)) A 3x(P(x) À Q(x)) = 3x(P(x) À R(x)) 

Montrez que À est valide en montrant que — À est contradictoire par la méthode de Herbrand, en suivant les 
étapes suivantes : 


1. (10 points)  Skolémisez A puis mettez-la en forme clausale. 


2. (5 points) Proposez des instances contradictoires des clauses obtenues et montrez la contradiction par 
résolution propositionnelle. 


Exercice 5 (Résolution (15 points)). 
Considérons l’ensemble suivant de clauses du premier ordre : 


D {R(x,y) + R(f(x),2), R(a,y) + Rx, f(x), R(x,y) + R(y,2) + R(x,2),  R(y,y)} 


Nous voulons montrer que cet ensemble de clauses est insatisfaisable par instanciation et par résolution. 


1. (7 points) Trouvez des instances contradictoires de ces clauses et montrez par résolution proposition- 
nelle que ces instances sont contradictoires. 


2. (8 points) Donnez une preuve directe du caractère contradictoire de T par factorisation, copie et 
résolution binaire. Il est possible que toutes les règles ne soient pas utilisées. 


Exercice 6 (Déduction naturelle (20 points)). 
Démontrez les formules suivantes en déduction naturelle au premier ordre. Comme vu en cours et en TD, on 
numérotera les lignes de la preuve, et on indiquera pour chaque ligne la formule démontrée, le contexte, la règle 
appliquée et les prémisses utilisées. 

1. (10 points)  VaVyVz(x = y A -(y = 2) (x = z)) 

2. (10 points)  2xP(x) A VaVy(P(x) À P(y) = x = y) = 


LI 


x(P(æ) À Vy(P(y) = x = y)) 


Exercice 7 (Connecteur complet (15 points, d’après un exercice du poly)). 

Soit | l’opération suivante : x | y = 1 si et seulement si x — 0 et y — 0. Cette opération est aussi appelée ni 
car x | y est vrai si et seulement si ni x, ni y ne sont vrais. 

L'objectif de cet exercice est de démontrer que ce connecteur est complet. 


1. (2 points) Donner une forme normale conjonctive et une forme normale disjonctive de la formule x | y. 
2. (2 points) Ce connecteur est-il commutatif (x | y = y|x) ? 

Est-il est associatif ((x | y) | z= x | (y | 2)) ? 
3. (1 point) Donner la table de vérité de la formule x | x. 


4. (10 points) Donner des formules équivalentes à chacune des formules : T, L, x, x AY, xVyetx = y 
en n'utilisant que le connecteur | et possiblement les variables x et y. On pourra justifier le résultat soit 
par des tables de vérité, soit en utilisant des équivalences avec les formules propositionnelles usuelles. 


Corrigés 


Exercice 1, page 1 


1. Contre-modèle par expansion : 
D = {0}: R(0,0).R(0,0) = R(0,0) valide 
D = {0,1} :(R(0,0).R(0,0) = R(0,0)).(R(0,1).R(1,0) = R(0,0)).(R(1,0).R(0, 1) = R(1,1)).(R(1, 1).R(1, 1) = 
R(1, 1) 
Tout Rj contenant les deux couples (0,1) et (1,0), et faux pour au moins un couple (i,i) convient. 
2. Modèle par expansion : 
D = {0} : P(0,0).(0 0) est insatisfaisable. 
D = {0,1} : (P(0,0).(0 £ 0) + P(0,1).(0 £ 1)).(P(1,0).(1 £ 0) + P(1,1).(1 £ 1)) = P(0,1).P(1,0) 
Tout Pr contenant (0,1) et (1,0) convient. 


Exercice 2, page 1 
1. Note : d’autres solutions sont admissibles, notamment selon la façon dont la symétrie des relations Voisin 
et Ami est prise en compte. 
(a) Les personnes qui sont assises côte-à-côte sont toutes amies. VrVy(Voisin(x, y) = Ami(x, y)) 


(b) Deux hommes ne sont jamais assis côte-à-côte. VrVy(Voisin(x, y) = Femme(x) V Femme(y)) 


c) Chaque femme est assise à côté d’au moins un homme. Vx(Femme(x) = 2y(Voisin(x,y)\-Femme(y))) 


) 

(c) 
(d) Personne n’est assis tout seul. VxyV'oisin(x, y) 
e) On ne peut pas être assis à côté de soi-même. VaVy(Voisin(x, y) = -x = y) 
) 


( 

(f) Personne n’est assis auprès de plus de deux personnes. VrVy1Vy2Vya(Voisin(x, y1) À Voisin(x, ya) À 
Voisin(x, ys) À -y1 = Ya > Y3 = Yi V Y3 = Yo) 

2. On à 2 femmes et 3 hommes, comme deux hommes ne peuvent être côte-à-côte, on alterne homme- 
femme-homme-femme-homme. Comme 0 et 3 se détestent, la femme 3 doit être entre 1 et 2. On a donc 
Voisins = {(0,4), (4,1), (1,3), (3,2), (2,3),(3,1),(1,4),(4,0)}. 

Si on accepte 2 tables séparées, d’autres solutions du type homme-femme-homme et femme-homme sont 
possibles. 


Exercice 3, page 2 


1. h(a, g(x,b), f(y)) = h(x, g(a, y), f(y)) 
Décomposition : a = x, g(x,b) = g(a,y), f(y) = f(y) 
Identité : a = x, g(x,b) = g(a,y) 
Décomposition : a=x,x=a, b=7Yy 
Élimination de x : a = a T:=a,b=Yy 
Identité : x:=a,b=7y 
Orientation : t:=a,y=b 
Élimination de yixi=a y:=b 
<æx:=a,y:=0b > est une solution la plus générale de l’équation. 
2. H(x, y, 9(æ,b)) = h(y, z,9(/(2),0)) 
Décomposition : x = y, y = 2, g(x,b) = g(f(2),b) 
Élimination de x : x := y, y = 2, g(y,b) = g(f(2),b) 
Élimination de y: x:=2,y:= 2, g(z,b) = g(f(z),b) 
Décomposition : æ:=2,y:=2,2= f(2),b=b 


Échec de l'élimination de z pas de solution 


3. h(x,y, g(x,y)) = h(z, 2, g(g(a,b), f(a))) 
Décomposition : x = z, y = 2, g(x,y) = g(g(a,b), f(a)) 
Élimination de x : x := 2, y = 2, g(z,y) = g(g(a,b), f(a)) 
Élimination de y: x:=2,y:= 2, g(z,2) = g(g(a,b), f(a)) 
Décomposition : æ:=2,y:= 2,2 = g(a,b), z = f(a) 
Élimination de z : x := g(a,b), y := g(a,b), z := g(a,b), g(a,b) = f(a) 


Échec de la décomposition : pas de solution 


ù 
s) 
S 


Exercice 4, page 2 


1. Forme normale : Vx(-Q(x) V R(x)) A Ax(P(x) À Q(x)) A Vx(-P(x) V -R(x)) 
2. Forme propre : Vx(-Q(x) V R(x)) A 2y(P(y) À Q(y)) A Vz(-P(:) V -R(:)) 
3. Elimination des 1 : Vx(-Q(x) V R(x)) A P(a) A Q(a) AVz(-P(2) V -R(:)) 
4. Enlèvement des V : (-Q{(x) V R(x)) A P(a) A Q(a) A (-P(z) V -R(:)) 
5. Forme clausale : {-Q(x) V R(x), P(a), Q(a),-P(2) V -R(2)} 
6. Instances contradictoires : -Q(a) V R(a), P(a), Q{a), -P(a) V -R(a) 

1: -—Q(a)VR(a)  Hyp 

2: Q(a) Hyp 

3: R(a) Res 1,2 

4: —P(a)V-R(a) Hyp 

5: —P(a) Res 3,4 

6: P(a) Hyp 

M cl Res 5,6 


Exercice 5, page 2 


Instanciation : Nous obtenons les instances contradictoires suivantes : 
{R(a,a) + R(f(a),a), R(a,a)+R(a,f(a)), R(a,f(a)) + R(f(a),a) + R(a,a), R(a,a)} 


Par résolution propositionnelle nous avons la preuve : 


1:/] R(a,a) + R(f(a),a) Hypothèse 

2: | R(a,a) Hypothèse 

3: | R(f(a),a) Révolvant 1,2 

4: | R(a,a) + R(a, f(a)) Hypothèse 

5: | R(a, f(a)) Résolvant 2,4 

6: | R(a, f(a)) + R(f(a),a) + R(a,a) | Hypothèse 

7:) R(a, f(a)) + R(a,a) Résolvant 3,6 

8: | R(a,a) Résolvant 5,7 

9: L Résolvant 8,2 

Résolution binaire : 

1: | R(x,y) + R(f(x),x) Hypothèse 
2: | R(y,y) Hypothèse 
3: | R(t,t) Copie 2 <xr'=t> 
4: | R(f(6),t) Révolvant 1,3 | <x:=t,y:=t> 
5: | R(x,y) + R(x, f(x)) Hypothèse 
6: | R(t,f(t)) Résolvant 3,5 | <r:=t,y:=t> 
7: | R(x,y) + R(y,2) + R(x,2) | Hypothèse 
8: | R(x,f(t)) + R(x,t) Résolvant 4,7 | <y:= f(t),2:=t> 
9: | Ru, f(u)) Copie 6 <t:=u> 
10 : | R(u,u) Résolvant 89 | <r:=u,t:=u> 
lil Lt Résolvant 10,3 | <t:=u > 


Exercice 6, page 2 


1. VaVyW2(x = y A (y = 2) (x = 2)) 

contexte | numéro | preuve règle 

1 1 Supposons x = y A (y — 2) 

1,2 2 Supposons x = Z 

1,2 3 t=y AE1 1 

1,2 4 y = ZX congruence 2, 3 

15 5 (y = 2) AE2 1 

1,2 6 de 3 E4,5 

1 7 Donc —(x — 2) = 12,6 
8 Donc x =y/ (y = 2) (x = 2) SU 17 
9 Vz(x = yA-(y = 2) (x = z)) VI 8,2 
10 VyVz(x = y A-(y = 2) (x = z)) VI9,y 
11 VaVyWz(x = y A -(y = 2) (x = 2)) | VI 10, x 


2. xP(x) À VaVy(P(x) À P(y) = x = y) = x(P(x) A Vy(P(y) = x = y)) 


contexte | numéro | preuve règle 

1 1 Supposons AxP(x) À VaVy(P(x) À P(y) = x = y) 

1 2 JxP(x) AE1 1 

1,3 3 Supposons P(x) 

1,3,4 4 Supposons P(y) 

1,3,4 5 VaWy(P(x) À P(y) = x = y) AE2 1 

1,3,4 6 Vy(P(x) À P(y) = x = y) VE 5,x 

1,3,4 7 P(x) A P(y) = x =y VE 6,y 

1,3,4 8 P(x) À P(y) AI 3,4 

1,3,4 9 T =Y = E 8,7 

1,3 10 Donc P(y) = x =y = 14,9 

1,3 11 Vy(P(y) = x = y) VI 10, y 

1,3 12 P(x) A Vy(P(y) = x = y) AE 8,11 

1,3 13 Je(P(x) A Vy(P(y) = x = y)) 31 12, x 

1 14 Donc P(x) = 2x(P(x) A Vy(P(y) = x = y)) = 13,13 

1 15 Je(P(x) A Vy(P(y) = x = y)) E 2, 14 
16 Donc x P(x) A VaVy(P(x) À P(y) = x = y) = x(P(x) À Vy(P(y) = x = y)) | = I 1,15 


Exercice 7, page 2 


1 æ|y=xÿ 
2. Elle est commutative : x|y=tÿ=yT=y|x 
Par contre (110)|0=0[0=12Z40=1|1=1|(01|0) 


3. On vérifie que x | x = %. 


4. 
= LUS 
ce u æ|x 

zAy = (x|z)|(yly) 
zVy = (x|vy)|(x|y) 
zy = ((x\x)|y)|((&@lx)ly) 


BDDC v2 
À basic bdd-based logical calculator 


Pascal RAYMOND 


November 24, 2008, (rev. September 30, 2022) 


BDDC is a tool for manipulating logical formula. It is based on a Binary 
Decision Diagram library, that means that each formula is internally tran- 
formed into a canonical form. In particular, if the formula (resp its negation) 
is a tautologie, BDDC will transform it into the ” always true formula” (resp. 
the ”always false formula”). 

All classical operators are provided. Moreover the tool provides a ” functional- 
like” language that allows the user to define his (her) own logical operators. 


1 Description 


1.1 Basic features 


The badc utility implements an interactive processor for the evaluation of 
logical formula. It reads commands from the standard input, and prints 
the result to the standard output. The main commands are those which in- 
volve Boolean expressions: basically, bddc computes a bdd (binary decision 
diagram [1, 2]), which is a canonical representation of the expression. 

For instance, if the user types the expression ”x + y.z ;”,the calculator 
interprets symbols x, y and z as Boolean arguments (ï.e., basic propositions), 
and the whole expression as à Boolean function over those arguments. Note 
that ”+” stands for logical or, and ” .” operator for logical and. The cal- 
culator builds the bdd corresponding to the expression, and then prints a 
polynomial representation of this canonical form; in the example, it simply 
outputs ”x + y.z” (useful, isn’t it?). 

If the expression is a tautology, its bdd is the always-true function: for 
instance, if the user types x => (y => x) ;” (=> is the logical implication), 
the result is ”true”. 


1.2 Advanced features 


The user may assign an expression to a variable, and then use this variable 
to build a new expression (”>>” is the prompt symbol of the processor): 


>>f := (y => x); 


X + -y 
>>x => f; 
true 


Moreover, the user may define new operators on bdds. For instance : 


>>union(A, B) := À + B; 

--new function: union, arity: 2 
>>union(x.y, t); 

X.y + t 


Indeed, this example is quite stupid. Defining new operators becomes inter- 
esting when using control operators and recursion (see 5.3, 6). 


2 Lexical aspects 


Lists are coma-separated (,). 
Identifiers are any strings starting with a letter, and containing only 
letters, digits and underscore symbol, excepting the following keywords: 


and constrain compare cuts cnf 
del dnf else exec exist 
false forall help high if 

in ite implies let list 
low nor not or print 
quit reed restrict root set 
size syntax then true xor 


The sequence // starts a comment, which ends at the next new-line. The 
sequence /*x starts a comment, which ends at the next *x/ sequence. 


3 Commands 


The processor is started by the command bddc, then the user enters an 
interactive session. 


quit 
exits the processor. 


help 


prints the list of commands. 


exec "command-file" 


reads commands from a file. 


syntax 


prints the syntax of logical expressions. 


list 


prints the list of arguments and variables in the current context (see 5.2). 


exp; 

builds the bdd corresponding to the expression in the current context, and 
outputs a polynomial equivalent to this bdd. 

ident := exp ; 

builds the bdd corresponding to the expression in the current context, as- 
signs it to the variable ident, and outputs a polynomial equivalent to this 
bdd. 

ident( identlist) :— exp; 


defines a function, wich can be used latter in logical expression. 


print ident 

print à polynomial equivalent to the bdd held by the variable ident. This 
command is obsolete: it is equivalent to type ”ident;”, since a identifier is a 
logical expression. 

size exp; 

prints the size of the bdd corresponding to exp. This size is expressed as a 
number of ”’bdd nodes” (see 5.1). 

[dnf, cnf, reed] exp; 


those commands are quite equivalent to typing ” exp;”, except that the out- 
put is printed (respectively) in disjunctive, conjunctive, or Reed-Muller nor- 
mal form (see 5.5). 


set [dnf, cnf, reed] 


sets the output mode (disjunctive, conjunctive, or Reed-Muller normal form see 5.5). 


4  Logical expressions 


The calculator provides all the classical Boolean operators, plus some other 
specially dedicated to the bdd implementation. The syntax is infixed, and 
the expression can be typed on more than one line, so don’t forget the 
terminating symbol ” ;”! 

4.1 Boolean operators 


false 


(or 0”) always-false function. 


true 


(or ”1”) always-true function. 


ident 


reference to an argument or a variable (depending on the current context). 


not exp 


(or ”-exp”) complement. 


exp or exp 


(or ” exp + exp”) disjunction. 


exp and exp 


(or exp . exp”) conjunction. 


exp XOr exp 


(or exp <> exp”) exclusive or. 


exp => exp 


implication. 


exp = EXD 


equivalence. 


ite(exp,exp,exp) 


functionnal ”if then else”; ’ite(f,g,h)” is equivalent to ”f.g + -f.h”. 


forall identlist exp 


universal quantifier. 


exist identlist exp 


existential quantifier. 


# (exp-list) 


at most one true in the list. 


nor exp-list 


none is true in the list. 


xor (exp-list) 

exactly one true in the list. Warning: xor (x1,x2,...,xi) is NOT ”x1 xor x2 
xor … xor xi’ (except for i=2). 

4.2 Control operators 


Those operators allow the user to control the way expressions are evaluated. 


compare(exp,exp) 

returns 1 (the always-true function) if the two expressions are logically equiv- 
alent, O (the always-false function) otherwise. 

implies(exp,exp) 


returns 1 if the first expression implies the second one, 0 otherwise. 


cuts(exp,exp) 

returns 1 if the intersection of the two expressions is not empty (i.e. their 
logical and is not 0), 0 otherwise. 

if exp then exp else exp 


lazy ”if”: if the first operand is always-true (resp. always-false), the second 
(resp. third) operand is not evaluated; otherwise, it behaves as the ite 
operator. 


let ident :— exp in exp 

local variable definition : the first expression is evaluated in a new context 
where ident is undefined. Then, the second expression is evaluated in a new 
context where the first result is associated to ident. The original context is 
then restaured, and the second result is returned (see 5.2 for details). 


4.3 Bdd decomposition 


The following operators are specific to the bdd representation: in particular, 
they do depend on the internal order of the arguments. 

Every formula ”f” that actually depends on at least one argument (ï.e. 
neither O nor 1) is equivalent to ?”f = if root(f) then high(f) else 
low(£})”, where: 


e root(f) is the least argument £ actually depends on, according to the 
argument total order. 


e neither high(f) nor low(f) depend on root(f) 


See 5.4 for more details on Shannon decomposition and BDD. 


root(exp) 


the least argument which the expression depends on. 


high(exp) 

the high” branch of the expression (i.e. the formula when the root-var is 
true). 

low(exp) 

the low” branch of the expression (i.e. the formula when the root-var is 
false). 

root(exp-list) 


when called with more than one argument, the root function returns the 
minimal root-var of all the expressions. This generalisation is quite useful 
when defining recusive functions on the bdd stucture. 


supp(exp) 


returns the support” of the exopression, that is, the ”or” of all arguments 
the formula depends on. 


A4.A  Simplification modulo care-set 


The following operators are specific to the bdd representation: in particular, 
they do depend on the internal order of the arguments. 

It is often the case that a particular formula is manipulated under a set 
of assumptions, or ”care-set”. 


restrict(exp,exp) 


’restrict(f,g)” is a function equivalent to ”f” if”g”; the result is simplier 
than ”f” (less bdd nodes). The result is a function À satisfying: 


if(fAg=0) then h=0 
if(fV-g=1) then h=1 
Otherwise, h is some function satisfying: 
(FAg)=h= (FV-9) 


N.B. The result is undefined if the second operand is ©. 


constrain(exp,exp) 


(also called the generalized cofactor) is a kind of ”restrict” operation. The 
result is not garanted to be smaller” than f, but it has an interesting (but 
not trivial) property: let h = constrain(f,g) 


h(x) = f(x") where x’ = ”the closer point to x in g” 


The precise definition of the ”closer point …” function is a little bit 
complicated (and depends on the variable ordering), but the main result is 
that the choice of x’ does not depend on f. 

N.B. The result is undefined if the second operand is ©. 


4.5 Priorities 


Expressions can be enclosed within parenthesis. Some priorities are used to 
resolve ambiguities: 


e not, exist, forall, 
e else 

e and 

e or 


e => (right associative) 


e =, xor (right associative) 

e in 
For instance: 
let z := t = v in - exist x if y then x else z+z=y=>2z; 
is interpreted as: 


let z := (t = v) in ((- (exist x (if y then x else z)) + z) = (y => z)); 


5 Appendix 


5.1 Notes on BDD size 


The tool uses a internal representation knowned as ”signed binary decision 
diagrams” (SBDD). With this representation, a boolean function F and its 
negation —Æ are (almost) represented by the same internal structure (they 
differ only on a boolean flag). With classic BDDSs, the internal representation 
of F and —F are disjoints. As a consequence, the cost of the negation is 
constant with SBDDSs, since it is linear with classical BDDs. Moreover, it 
is known that this representation is always cheaper (in size and in time 
computation) than classical BDDs. 


5.2 Notes on identifiers 


The calculator deals with several kinds of identifiers: 


arguments are the (global) free variables, ie. identifiers that was once 
used without being first declared. 


global variables are the identifiers introduced at the top level by à assign- 
ment command. 


local variables are either formal parameters of a user-defined function, or 
identifiers introduced by a let operator. 


The way an identifier is interpreted (ï.e. the identifier’s status) depends 
on the current context. Intuitively, at the top level, there is a global context, 
giving the status of arguments and global variables. The status of a global 
identifier is implicitly given by its first occurence: if it first appears in the 
left hand side of an assigment, the status is variable; if it first appears in an 
expression, the status is argument. One can type ”’list” to see the current 
global context : 


>>x := a . b; 

x := à . b 

>>list 

parameters are: a b 
variables are: x 


An argument cannot be re-used as a global variable; a variable, indeed, can 
be re-assigned': 


>>a := X; 

can’t assign "a", not a variable 
>>x := a + b; 

x := a tb 


Arguments are globals, while the scope of variables can be restricted 


using the let ... in ... operator. 
>>y := let z := c + d'in z; 
Y := c+d 


>>list --note that z has disappeared, but not c and d: 
arguments are: a b cd 
variables are: x y 


If id is a variable, let id := ... shadows the current value of id 


>>Y; 

c + d 

>>z := let y := (let y := e.f in y.g) in x + y; 
zi= a + b+e.f.g 

>>Y; 

G ‘+4 


Moreover, a local declaration shadows the status of the identifier: 


>>a; 

a 

>>let à := e.f in a; 
e.f 

>>a; 

a 


5.3 Notes on user-defined functions 


For the time being, no static verifications are made on user-defined functions. 
We can simply give the semantics for function calls: if the user has defined a 
function foo(i1, ..., ik) := exp;, then foo(ei, ..., en), where ei, 
.…, en are correct expressions, is à correct expression equivalent to: 


let ii := ei in 


let in := en in 


exp; 


In particular, a user-defined function may use free identifiers, but it is 
indeed quite dangerous: depending on the context call, those identifiers will 
be interpretted either as arguments, global variables, or even local variables 
of the current scope! 


5.4 Notes on Shannon decomposition 


The bdd decomposition is à special case of Shannon decomposition, where 
the choice of the decomposition variable is forced by the actual bdd repre- 
sentation. The general Shannon decomposition does not depend on the bdd 
structure, and can be obtained using logical operators; for all variable x and 
function f, we have f = (x A f1) V (-x A f0), where (in bdde syntax): 


f1 
f0 


exist x (x.f); -- or better: f1 := constrain(f,x); 
exist x (-x.f); -- or better: f0 := constrain(f,-x); 


5.5 Notes on output format 


By default, the tool prints the results in a disjunctive normal form (sum 
of ”’ands”). The idea is to make the result as ”’readable” as possible. The 
quality of the ”result” dramaticaly depends on the internal order of the 
arguments. For example, depending on the order of its arguments, the 
expression if À then B else C” can produce different (but equivalent) 
polynomials, such as *A.B + -A.C + B.C” or ’B.A + -A.C”. Indeed, the 
second form is ” better” since it is more concise, but the problem of printing 
the simpliest polynomial equivalent to a given function is exponential. So, 
there is no guarantee on the ” quality” of the print result. 

The user can also prints the results in a conjonctive normal form (product 
of or’s). This is the dual of the first form. 

The Reed-Muller normal form consists in expressing the boolean func- 
tions as polynomials in ’and” and ”xor” (the always-true function 1” is 
also necessary). This form is canonical (modulo the commutativity and 
associativity of the operators). For instance: 


>>reed (if À then B else C); 
>>B.A <> A.C <> C 

>>reed (not A); 

>>A <> 1 


This form is interesting (since it is canonical), but it can seem ”strange” 
and unreadable for most people! Moreover, there is no ”simple” relation 
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between the size of the Reed-Muller form and a classical polynomial form: 
one form can be exponentially better or worse than the other: 


>> +B+C; 
A+B+cC 


>>reed (A + B + C); 
A.B.C <> A.B <> A.C <> À <> B.C <> B <> C 


>>A <> B <> C:; 
A:B:C + A.-B.-C + =A.B.-C + =A.-B.C 


>>reed (A <> B <> C); 
A <> B <> C 


6 Examples 


6.1 Programming the negation 


The following function implements the Boolean negation. Indeed, using this 
function is quite ineffective, since the built-in not operator does the same 
thing in constant time, but this simple algorithm shows the genaral structure 
of any unary bdd-based operator. 


negation(a) := 
if compare(a, true) then false 
else if compare(a, false) then true 
else ite( root(a), negation(high(a)), negation(low(a))); 


In order to understand this algorithm, remain that any bdd a is either: 
e true, i.e. the always true formula, 
e false, i.e. the always false formula, 


e aternary ”expression” of the form ite(root(a), high(a), low(a)), 
where root(a) is an argument |, and high(a) and low(a) are two 
formulas not depending in root (a). 


The algorithm first treat the basic cases, by comparing the parameter 
to the constants true and false, and after the genaral case, where the 
parameter still depends on some argument. In this case, the function is 
recursively called on the corresponding high and low parts, and the results 
are combined under à test of the root argument. 


TMore precisely the identity formula associated to an argument 
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6.2 Finding an implicant in a bdd 


This is another example of unary function, that builds, if it exists, an mono- 
mial that implies a : 


path(a) := 
if compare(a, true) then true 
else if compare(a, false) then false 
else if compare(high(a), false) then (not root(a) and path(low(a))) 
else (root(a) and path(high(a))) 


6.3 Programming the union 


The following function implements the Boolean or. The only interest is in 
showing how to build a binary operator. We first treat the basic cases, where 
either a, b are constants. Then, we treat the case where both a and b are 
’binary” bdds. In this last case, we use the binary extension of the root 
operator to get the minimal” argument between root(a) and root(b), 
and call it min root. Then, the recursive calls are made by decomposing 
both parameters according to min root. 


union(a, b) := 
if (compare(a, true) or compare(b, false)) then a 
else if (compare(b, true) or compare(a, false)) then b 
else let min_root := root(a, b) in 
ite(min_root, 
union(constrain(a, min_root), constrain(b, min_root)), 
union(constrain(a, not min_root), constrain(b, not min_root)) 


); 


The use of the generalized cofactor in the recursive calls may seem 
a little bit tricky. It is justified by the fact that (for instance) either 
constrain(a, min root) = a if min root # root(a), or constrain(a, 
min root) = high(a) ifmin root — root(a). 
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Résumé 


On critique les notations usuelles des dérivées, car elles sont basées sur une 
confusion entre fonctions et expressions. On propose d’autres notations qui res- 
pectent la différence entre fonctions et expressions. Ma reflexion a été stimulée par 


la lecture du polycopié de[Kevin Santugini] Il critique l’incohérence des notations 


des dérivées partielles mais renonce à en changer, car, écrit-il, "ces notations sont 
maintenant trop ancrées dans l’usage pour les remplacer". Je partage sa critique 
mais, contrairement à lui, je pense qu’il serait utile de changer ces anciennes nota- 
tions, pour des notations plus conformes à l’usage des logiciels de calcul formel et 
aux essais de formaliser l’analyse dans les assistants de preuves. 


1 Dérivées partielles des fonctions 


Dès le début de l’article de wikipédia sur les la définition de ces 
dérivées est incorrecte. Je cite ce début : la dérivée partielle d’une fonction de plusieurs 
variables est sa dérivée par rapport à l’une de ses variables, les autres étant gardées 
constantes. Ce que je critique ici, c’est l’oubli de la différence entre les expressions, 
qui ont des variables, et les fonctions, qui n’ont pas de variables. 

Dans la suite, je ne considère que des fonctions sur les réels. Une fonction à n ar- 
guments est une application de D — R où D C R”. À mes yeux, l'expression "fonction 
de plusieurs variables" n’a aucun sens. 

Soit f une fonction à deux arguments. Je note la dérivée partielle de f par rapport 
à son premier argument par dE. Cette dérivée partielle peut aussi être notée à (f). 

La dérivée partielle de f par rapport à son deuxième argument est notée dé. Cette 


dérivée partielle peut aussi être notée & (f). 
Ces deux dérivées sont aussi des fonctions à deux arguments et sont définies ainsi : 
d : x+h,y)—f(x,y 
L (x,y) tn >) f(x) 


— pour tous x,y ER, + 
P é o1 h—0 


— pour tous x,y € R SE (x, y) = lim FPE 
: h—0 . : 
On étend ces notations aux fonctions à n arguments où n est un entier strictement 
positif. Soit f une telle fonction et i un entier tel que 1 <i<n. 


Pour tous x1,.…x ER, Y(x1,...xn) = lim fGex Lx theret 2) PRE) 
h—0 


Lorsque f est une fonction à un seul argument, la fonction de à un seul argument 
est aussi notée f”. 


Soit f une fonction à deux arguments. Puisqu’alors les fonctions 2 et de af sont 
| . ON oÙ où où 
comme f des fonctions à deux arguments, on peut définir les fonctions —ÿ, 22,21, 22. 
aussi à deux arguments, qui sont abrégées respectivement en ue _s 
Notons par & la liste vide. Par récurrence sur les listes 4 de 1 et 2, on peut définir 


2 ainsi 
U àf 
— SL =f , 
_ da 
dlu au 
Lu 
d2u d2 


On peut facilement généraliser ces notations pour des fonctions avec un nombre n 
d’arguments, en remplaçant ci-dessus les suites de 1 et 2 par des suites de 1,2,...n. 


Remarque 1 Une liste d'éléments, dont chaque élément est représenté par un seul 
caractère, peut être représentée par la concaténation de ses éléments. Par exemple 
la liste des éléments 1 2 3 2 peut être représentée par 1232. Mais lorsque certains 
éléments sont représentés par plus d’un caractère, la liste est mise entre parenthèses et 
ses eléments sont séparés par une virgule. Par exemple la liste des éléments 1 21 3 22 
est représentée par (1,21,3,22). Suivant le contexte, nous prendrons l’une ou l’autre 
représentation des listes. 


Pour un complément sur les fonctions de plusieurs variables, sur les notions de 
continuité et sur une présentation des dérivées partielles avec les notations classiques, 


je recommande la lecture ducours de Bernard Ycart 


2 Dérivées des expressions 


Définition 2 Expression 
Une expression est une constante, une variable ou une fonction appliquée à des expres- 
sions. 


On suppose que l’ensemble des constantes et celui des variables sont disjoints. La 
syntaxe concrète des expressions n’est pas définie. Par exemple la somme des deux ex- 
pressions el et e2 est notée par la syntaxe abstraite, dite aussi préfixée, somme(el ,e2), 
la fonction somme est appliquée aux deux expressions el et e2, ou par la syntaxe 
concrète, appelée encore infixée, el + e2. De même le produit de ces deux expres- 
sions est notée par la syntaxe abstraite produit (el,e2) ou par l’une des trois syntaxes 
concrètes el *e2, el.e2, ele2. 

Soit e une expression à valeur réelle et x une variable de type réel. La dérivée, de 

d 


l'expression e par rapport à la variable x, est notée de et parfois aussi #(e). 


Définition 3 

Soit e une expression, x une variable et f la fonction définie par f(x) = e. 
Soit f' la fonction dérivée de f. de est une expression qui vérifie : f'(x) = de, 
On introduit la notation comme désignant la dérivée f' de la fonction f. 


Par suite f'(x) = % = Be (x) 


Exemple 4 Soit f(x) = x2. Nous avons f'(x) — de =?xi— Et) 


Remarque 5 Soit e une expression et x une variable. Dans lelcours de Bernard Ycari 


la notation de est utilisée avec le sens de êe . Bernard Ycard a le mérite de garder 


toujours le même sens. Mais il est fréquent, dans beaucoup de cours et d'articles, 
PTE 3 : de Soi D : de : de 
d'utiliser la même notation > pour désigner l'expression T et la fonction & et de 


faire confiance au contexte pour distinguer les deux sens. 


Dans la suite de ce document, on n’utilisera plus jamais la notation ô. On utilisera 
la notation de uniquement lorsque e est une expression. 


Lemme 6 
Soit f une fonction à deux arguments et x,y deux variables distinctes. 


La première dérivée partielle de f est définie par : 2 (x,y) = GG) 
La dauxième dérivée partielle de f est définie par : SE (x,y) _ ae 


Preuve : Soit g la fonction définie par g(x) = f(x, y). D’après la définitionfA] age) — 


dx 
FEtRD) FO), Par définition de la première déri- 


g'(x). Par définition de g, g/(x) — lim 

1 — 
vée partielle de f, et puisque g(x) = f(x, y), nous avons donc : 
(x,y) = EN), 


dx 


d(f(xy)) 
dy 


d 
On prouve de façon analogue que a (x,y) = 


On généralise le lemme ci-dessus aux fonctions ayant n arguments. 


Lemme 7 Soit f une fonction d’un domaine inclus dans R” dans R et soient x1,...xy 
n variables distinctes. 
of 


Nous avons pour tout i tel que 1 <i<n:=%(x1,...x») = dE »%n)) 


dx; 


La preuve est omise car c’est une simple généralisation de la preuve du lemme 


précédent. Dans la notation traditionnelle, la dérivée partielle og est abusivement notée 


. en utilisant des variables arbitraires pour désigner les arguments de la fonction f. 
à | 


3 Dérivées des dérivées 


Puisque la dérivée d’une expression est une expression, on peut dériver la dérivée 
d’une expression. 


Exemple 8 dérivée de dérivée d’une expression 


d(xx32 +2 ) 2 
AR) _ dE 2x) 
à = 5 =2xy+2%xx 
d(xxy2 +yx2) 2 2 
s —— 7% —) d(xxy"+y#x°) 
On abrège à en a 


d(S) 
: : : “ 5 de L 2 

Soit e une expression et x, y deux variables. On abrège x A dy Et plus géné- 
ralement, on définit par récurrence la dérivée d’une expression par rapport à une liste 


de variables. 


Définition 9 dérivée d’une expression par rapport à une liste de variables 
Soit & la liste vide, soit x une variable, soit u une liste de variables, soit e une expression. 


de _ 
1. Œ —€ 

d 
2 du — de 
© dx  dxu 


On généralise le lemmefé|au cas de composition de plusieurs dérivations. On com- 
mence par le cas des fonctions à deux arguments. 


Lemme 10 Soit f une fonction à deux arguments. Nous avons : aUGD) dE (x,y) 


dx 12 
l(f(xy)) _ df d(f@y)) _ of d(f(x»)) __ af 
de = 310} ri = 51%) . = 32). 


Preuve : Par définition des dérivées de dérivées des expressions, nous avons 


af») | 4) 


dxy dx 


D’après le lemme [6] nous avons 


d(f(xy)) _ df 
dd. = 39 )) 


D’après ce même lemme, appliquée à l'expression (x, y) (au lieu de l'expression 
f(x, y)) et à la fonction a (au lieu de la fonction f), nous avons 
d d 
da) _ AG) 
dx ol 
Par définition des dérivées des fonctions (voir paragraphe} nous avons 


(x, 7) 


d(F(xy)) 
dxy 


ne . ; : _ of 
D’après les quatre équations ci-dessus, nous avons = 55 (x,y). On prouve 


de façon analogue les autres égalités du lemme. 


Nous généralisons le lemme ci-dessus, à un nombre quelconque d’arguments et de 
dérivations. 


Lemme 11 Soit f une fonction à n arguments. Pour tous les entiers ij,...ix compris 
entre 1 et n, nous avons : 


of (x1,...%n) = d(f(R1;-2xn)) 


di... dxi, Xi, 


Nous ne faisons pas la preuve de ce lemme, car c’est une simple généralisation du 


lemme précédent. La dérivée C1) de l’expression f(x1,...x,) est une dérivée 
mA 


d’ordre k de l’expression. De même la dérivée Fe & de la fonction f est aussi appelée 
dérivée d’ordre k de la fonction. 


4 Symétrie des dérivées de tous ordres 


Soit f une fonction sur un domaine inclus dans R” dans R. Il avait été affirmé par 
Bernoulli, Clairault, Young, avec des preuves incorrectes, ainsi qu’il est constaté dans 


a version anglaise de wikipediaique pour tous à, j où 1 <i,j <n, 


of _ of 
dj où is 

ij ji 
Attention, j emploie ici la notation des dérivées partielles définie au paragraphe [1] 
Dans la version usuelle, la dernière égalité est notée af en . Les variables sont 


+ L : . . Oxix ; xx . . > 
utilisées (à tord à mon avis) pour désigner les arguments de la fonction f, ce qui crée 
une confusion entre les expressions qu’on dérive relativement à une variable et les 
fonctions qu’on dérive relativement à un de leurs arguments. 


Leltheorème de Schwarz| donne des conditions suffisantes pour que l'égalité [T]soit 


vérifiée. 


Théorème 12 (Théorème de Schwarz) 


Soit f une fonction sur les réels définie sur un ouvert D où D C R". Soient i, j deux 
2f er 9 


entiers tels que 1 <i< j < n. Supposons que les deux dérivées partielles dj À Dj SON 
; df (4) — 9 
continues sur D. Alors, pour tout a € D, 3 (a) = 3 (a) 


La preuve de ce théorème est (très bien) faite dans l’article du wikipedia anglais 
référencée ci-dessus. Puisqu’une permutation d’une liste d’entiers est une combinai- 
son de transpositions élémentaires, le théorème de Schwarz peut être généralisé aux 
dérivations de tous ordres. 


Définition 13 Fonction de classe k (où k > 0) sur un domaine 
Une fonction f définie sur domaine ouvert D où D € R’ est de classe k sur ce domaine, 
si elle et ses dérivées partielles d’ordre au plus k sont continues sur ce domaine. 


Théorème 14 (Théorème de Schwarz généralisé) 
Soit f une fonction sur les réels de classe k sur le domaine ouvert D où D CR". Si u et 
v sont des listes de longueur p, où p < k d’entiers entre 1 et n et si ces listes sont des 
permutations l’une de l’autre, alors pour tout a € D, of (a) = of (a) 
Preuve : Une transposition élémentaire est un échange entre deux éléments consécutifs 
d’une liste. Puisque toute permutation est un produit de transpositions élémentaires, 1l 
suffit de vérifier le théorème lorsque v est obtenue par une transposition élémentaire 
effectuée sur u, autrement dit lorsqu’il existe deux listes w et x, deux entiers i et j tels 
que u = wijx et v = wjix. 

Soit a € D. Par définition des dérivées partielles des fonctions, nous avons 


2f x) 
Owijx de dw (a) @ 
a(9) 
(5) 
— a (3) 


Puisque la fonction f est de classe k sur D, la fonction dérivée of est continue 
et deux fois dérivable sur ce domaine. Par suite on peut lui appliquer le théorème de 
Schwartz et par conséquent pour tout a € D 


d(%) 
dij 


_ A(É) 
= (a) (4) 


D'après la définition des dérivées partielles des fonctions, il en résulte que pour 
tout a € D nous avons 


0 
_ djix 


LE 
dijx 


(a) (a) (5) 


7 _— of ___ of 
En dérivant par w, on en déduit que pour tout a € D, Ses (a) = RE 
fallait prouver pour la transposition élémentaire de ij en ji. 


(a), ce qu’il 


Le logiciel xcas, voir M] et EP]. écrit et maintenu par Bernard Parisse, est un logiciel 
de calcul formel, avec d’innombrables possibilités. J’indique ici comment dériver une 
expression relativement à des variables. 

Le calcul de dE) est réalisé par la commande dif f(x3 xy2, y,x,x). 

Le corollaire suivant montre que l’ordre des dérivations est sans importance, c’est- 
à_dire que dif f(x3 x y2,y,x,x) = dif f(x"3 x y12,x, y,x) = dif f(x13 x yN2,x,x, y). 

Cela justifie la notations par xcas de cette dérivation par la commande dif f(x"3 x 
y"2,x$2, y$1), les indications x$2 et y$1 précisent qu’il faut faire deux dérivations selon 
x et une dérivation selon y, l’ordre de ces dérivations étant sans importance. 


Corollaire 15 (Théorème de Schwartz et dérivées des expressions) 
Soit D un domaine ouvert inclus dans R" et soit f une fonction de classe k (où k > 2) 
sur ce domaine. Soit p un entier où p < k, soit i,...i, une liste d’entiers entre 1 et n. 


Nous avons 
d(f(x1,...xn))  d(f(x1,...x)) 


= (6) 
dxi, Xi, dx;, cX;, 
où j1,...j, est une permutation quelconque de i1,...i,. 
: » x d(f(xi1:.xn)) __  df 
Preuve : D'après le lemme|1 1} nous avons FER ee (X1,...Xn). 
D’après le théorème de Schwartz généralisé , nous avons Le (x1,...Xn) = La 
; dt Ne ? dj1...jx 
D’après le ai nous aVONS 37 7 (x1,...Xn) = Rp D’après ces trois éga 
d(f(x1:..xXn)) _ d(f(x1:..xn)) 


lités, on a 


dxi, Ain dx, À jp 


5 Dérivation et composition des fonctions 


Théorème 16 Soient e1,...e, une suite d'expressions. Soit x une variable. Soit f une 
Jonction sur les réels définie sur un domaine D inclus dans R”. Supposons que f est de 
classe C1 sur le domaine D et que (e1,...e,) est dans ce domaine. Supposons que pour 


(CSTEE 


Xn) 


d(ei) 


tout i et pour x les dérivées == sont définies. Lorsque ces conditions sont vérifiées, 
nous avons : 


Ce théorème est souvent énoncé comme une relation entre différentielles : 


d(f(e1,...en)) = Ve...) 


i=1 


En divisant par dx, on obtient le théorème ci-dessus. 
Le théorème reste vrai lorsque f au lieu d’être une fonction d’un domaine D où D C R" 
dans R est une fonction de D dans R?. 


Exemple 17 Vérifions le théorème[T6]sur un exemple. Soit f définie par f(x,y) = 2xy. 
Calculons de deux manières distinctes CE), 
Par définition de f, AFG3») — 42m) = 12y. 
D'après le lemme|6| nous avons 


. (x, y) _ d(fG»)) _ d(2xy) 2y 


o as) _ 42) 
D (x,9) — a = … = 2x 
Calculons 9 (2x,3y) * aa) de SE (2x, 3y) * 2G), 
L'expression 42° valant 0, (2x, 3y) valant 6y, “2 valant 2, la somme ci-dessus 


: : d(f(2x,3y)) 
vaut 12y, ce qui est bien la valeur de ===. 


Lorsque la fonction f n’a qu’un argument, le théorème[T6|implique le corollaire suivant 


qui, en français, est le théorème de la dérivée des fonctions composées et, en anglais, 
est la Chain rule. 


Corollaire 18 Soit f et g deux fonctions à un argument. Si g est dérivable en x et f est 
dérivable en g(x) alors (fo g)'(x) = f'(g(x)) *g'(x). 


Preuve : Posons g(x) — e. Puisque g est dérivable en x et que g’(x) = LUN l'expression 
de) est définie. Puisque f est dérivable en g(x) et que f’(g(x)) — Ge) , l'expression 
260) est aussi définie. Donc, par application de théorème [16] dans le cas où n = 1, 


nous avons a(fte)) = f'(e)* de. En remplaçant e par g(x), nous obtenons 
D = ED = (fo 8) (0) = F0)» ED = F'(e(x))* 8/00. 
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Biection entre les topologies d’Alexandroff et les 
préordres 


Michel Lévy 
21 janvier 2015 


Définition 1 (Préordre) 

Un préordre est un couple (E,R) où R est une relation réflexive et transitive sur 
l’ensemble E. 

Soient e, f € E tel que eRf : f est un successeur de e. 

Soit À un sous-ensemble de E. L'origine de À, relativement au préordre, est l’en- 
semble des élements de E dont tous les successeurs sont éléments de À. L'origine de A 
est notée 0( R)(A), et souvent o(A) quand le préordre est implicite. 


Lemme 2 (Propriété de l’origine d’un ensemble) 
Soit (E,R) un préordre. L'origine vérifie les propriétés suivantes : 
o(O) —0 
2. o(E)=E 
3. Pour tous A,BC E, si A C B alors o(A) C o(B) 
4. Pourtout AC E, o(A) CA 
5. Pourtout AC E, o(o(A)) = o(A) 


Es 


Preuve : Les propriétés [T] P] Glsont des conséquences immédiates de la définition de 
l’origine. 

Soit a € o(A). Tout successeur de a est dans À. Puisque R est reflexive, a est son 
propre successeur, donc a € À, ce qui prouve [4 

Prouvons la propriété Pl D’après la propriété précédente, o(o(A)) € o(A). Il suffit 
donc de prouver que o(A) € o(o(A)). 

Soit a € o(A). Tous les successeurs de a sont éléments de À. Soit b un successeur 
de a. Tout successeur de b est, par transitivité de R, aussi un successeur de a donc un 
élément de À. Par suite b € o(A). Donc tous les successeurs de a sont dans o(A). Et par 
conséquent a € o(o(A)) 


Définition 3 (Topologie) 

Une topologie est un couple (E,T) où T est un ensemble de sous-ensembles de 
E, contenant E et 0, tel que l'intersection de deux éléments de T est un élément de T 
et l’union d'éléments de T est un élément de T. Un élément de T est un ouvert de la 
topologie. 


Une topologie d'Alexandroff[ June topologie (E,T) où l'intersection d'éléments de 
T est un élément de T. 


Définition 4 (Topologie associée à un préordre) Soit (E,R) un préordre. Soit T l’en- 
semble des A C E tels que o(A) = A. (E,T) est la topologie d’Alexandroff associée au 
préordre. 


Preuve : D’après les propriétés de o, l’ensemble vide et E sont des éléments de T. 

Montrons que l’union d’un ensemble d’éléments de T est aussi un élément de T.. 
Soit S un sous-ensemble de T. Montrons que o([JS) = US. D’après les propriétés de 
o, on sait que o(UJS) € US. Il suffit donc de montrer l’inclusion inverse. Soit a € (JS. 
Il existe À € S tel que a € À. Puisque À est élément de T, o(A) = À, donc tous les 
successeurs de a sont dans À, donc dans (JS. Par suite a € o(US). 

Montrons que l’intersection d’un ensemble d’éléments de T est aussi un élément 
de T. Soit S un sous-ensemble de T. Montrons que o(fS) = NS. Comme ci-dessus, 
il suffit de montrer que NS € o(NS). Soit a € MS. Pour tout À € S, a € A. Puisque S 
est sous-ensemble de T, pour tout À € S, a € o(A). Donc pour tout À € S, pour tout 
b successeur de a, on a b € A. Par suite pour tout b successeur de a, pour tout A ES, 
b € A. Par conséquent tous les successeurs de a sont éléments de NS, donc a € o(fS). 

Par suite, (E,T) est une topologie d’Alexandroff. 


Définition 5 (Préordre associé à une topologie) Soit (E,T) une topologie. Soit R la 
relation suivante sur E : eRf si et seulement si VA E T(eE A= f € A). Par définition 
de R, il est évident que (E,R) est un préordre, le préordre associé à la topologie. 


Théorème 6 
Soit (E,T) une topologie. Soit (E,R) le préordre associée à cette topologie. 
Soit (E,T') la topologie associée au préordre (E,R). On rappelle que T' est l’en- 
semble des À C E tels que o(A) = A. 
T CT', comme on dit usuellement (E,T') est une topologie plus fine que (E,T). 
SiT est une topologie d'Alexandroff, T = T'. 


Preuve : Montrons que T C T’. 

Soit À € T et a € À. Soit b tel que aRb, un successeur de a. Puisque (E,R) est 
le préordre associé à la topologie (E,T), VBET(ae B=bEeB). Puisque À ET et 
a € À, nous avons b € À. Donc, puisque tous les successeurs de a sont dans À, a € o(A). 
Par conséquent À C o(A). Puisque, d’après les propriétés de o (cf[2| o(A) C À, on a 
A = o(A), donc À € T”. 

Supposons que (E,T) est une topologie d’Alexandroff, autrement dit l’intersection 
d’éléments de T est un élément de T. Montrons que T' CT. 

Soit À € T'. Puisque o(A) — À, si a € A et b successeur de a alors b € A. Autrement 
dit, par définition de R:aE AAVBET(ae B=bEeB)=bEA. 

Puisque (E,T) est une topologie d’Alexandroff, pour a € À, le plus petit ouvert 
contenant a existe, car c’est l’intersection des ouverts (autrement dit, des éléments de 
T) contenant a. Notons ppo(a) cet ouvert. 


Soit D = [J{ppo(a) | a E A}. Puisque D est une union d’ouverts, c’est un ouvert, 
c’est-à-dire un élément de T'. Par définition de D, A C D. 

Montrons que D C À. Soit b € D. Il existe a € A tel que b € ppo(A). La condition 
b € ppo(a) s'écrit encore VBET(aeB=bEB). 

Puisque À vérifie a € AAVBET(ae B=be B)= bE A, il en résulte que b € À. 

Par suite À = D donc A ET. 


Théorème 7 La correspondance entre une topologie d'Alexandroff (ET) et son pré- 
ordre associé (E,R) où eRf si et seulement si VA ET(eEA= f € B) est une bijection. 


Preuve : D’après le théorème [6] cette correspondance est une injection. Puisque la to- 
pologie associée à un préordre, est une topologie d’Alexandroff, cette correspondance 
est surjective. 


Sens de Kripke et de Tarski de la logique 
intuitionniste 


Michel Lévy 
16 janvier 2015 


La logique intuitionniste (propositionnelle) est présentée avec deux sémantiques en 
apparence très différente : la sémantique de Kripke et celle de Tarski. Nous donnons 
la définition de ces deux sémantiques, puis nous montrons comment transformer un 
modèle de Kripke en un modèle de Tarski et réciproquement. 

L'ensemble des formules de la logique intuitionniste est l’ensemble construit à par- 
tir d’un ensemble de variables (noté Var) et des connectives AÀ,V,—=, L. Une variable 
est une suite de minuscules avec ou sans indice. Les majuscules dénotent des formules. 
La négation et l’équivalence sont considérées comme des abréviations 


L A=A= I 

2. A& B=(A—=B)1A(B—A) 
Formule(Var) est l’ensemble des formules dont les variables sont éléments de Var. 
Dans la suite toutes les formules sont implicitement éléments de cet ensemble et les 
variables sont éléments de Var. 


1 Définition des deux sémantiques 


1.1 Sémantique de Kripke 


Définition 1.1 (Préordre - Interprétation de Kripke) 

Un préordre est un couple (E,R) où R est une relation réflexive et transitive sur 
l’ensemble E. 

Soient e,f € E tel que eRf. L'élément f est un successeur de e. 

Soit À un sous-ensemble de E. L'origine de À, relativement au préordre, est l’en- 
semble des élements de E dont tous les successeurs sont éléments de À. L'origine de A 
est notée 0(g Ry(A), et souvent o(A) quand le préordre est implicite. 

Une interprétation de Kripke est un triplet (E,R,v) où (E,R) est un préordre et 
v: Var+ 2Ë est une application qui vérifie la propriété suivante : pour tout x € Var, si 
eev(x)eteR f alors f € v(x). 


Définition 1.2 (Valeur de Kripke d’une formule) 

Soit I = (E,R,v) une interprétation de Kripke. On étend l'application v en une 
application v£ : Formule(Var) + 2Ë de la façon suivante. Soient x une variable et À, B 
deux formules : 


1 
2. 
3. vk(AVB) = v£(A)Uv 
4 
] 


Définition 1.3 (Formule Kripke-valide) 
La formule A est Kripke-valide si et seulement si pour tout interprétation de Kripke 
1 = (E,R,v), vk(A) =E. 


Dans le document (http: 
trouve une autre présentation de la sémantique de Kripke et nous expliquons ici com- 
ment correspondent ces deux présentations. 


Définition 1.4 (Assignation) 

Soit I — (E,R,v) une interprétation de Kripke. Une assignation est un couple Ie 
composé de l'interprétation I et d’un élement e € E de cette interprétation. Une assi- 
gnation permet de donner une valeur de vérité à une formule. 


Dans le document cité, on trouvera une définition de la phrase Ze = À, l’assignation 
Ile est rend vraie la formule A. Il est clair que ces deux définitions de la sémantique de 
Kripke sont presque identiques, car elles vérifient : {e € E | Ie HA} = v£ (4). 

Autrement dit, relativement à une interprétation, la valeur d’une formule est l’en- 
semble des éléments rendant vraie la formule. 

Une formule est Kripke-valide si et seulement si toute assignation rend vraie la 
formule. 


1.2 Sémantique de Tarski 


Définition 1.5 (Topologie d’Alexandroff - Interprétation de Tarski) 

Une topologie est un couple (E,T) où T est un ensemble de sous-ensembles de 
E, contenant E et 0, tel que l'intersection de deux éléments de T est un élément de T 
et l’union d'éléments de T est un élément de T. Un élément de T est un ouvert de la 
topologie. 

Soit À un sous-ensemble de E. L'intérieur de À, relativement à la topologie, est 
le plus grand ouvert inclus dans A. L'intérieur de A est noté i(p.r)(A) et souvent i(A) 
quand la topologie est implicite. 

Une topologie d’Alexandroff (cf wikipédia 
est une topologie (E,T) où l'intersection 
d'éléments de T est un élément deT. 

Une interprétation de Tarski est un triplet (E,T,v) où (E,T) est une topologie 
d’Alexandroff et v : Var + 2Ë est une application qui vérifie la propriété suivante : 
pour tout x € Var, v(x) est un ouvert. 


Définition 1.6 (Valeur de Tarski d’une formule) 

Soit I = (E,T,v) une interprétation de Tarski. On étend l'application v en une 
application v} : Formule(Var) + 2£ de la façon suivante. Soient x une variable et À, B 
deux formules : 


1 
2, 
3. v 
4 
5) 


Il est évident (par récurrence sur les formules), que la valeur d’une formule est un 
ouvert. 


Définition 1.7 (Formule Tarski-valide) Une formule À est Tarski-valide si et seule- 
ment si pour tout interprétation I = (E,T,v) de Tarski, v} (A) = E. 


2 Relation entre les sémantiques de Kripke et de Tarski 


2.1 Préordre et espace topologique associé 


Lemme 2.1 (Propriété de l’origine d’un ensemble) 

Soit (E,R) un préordre. Soit À un sous-ensemble de E, on rappelle que l’origine de 
A, notée o(A) est l’ensemble des éléments de E dont tous les successeurs sont éléments 
de À. L'origine vérifie les propriétés suivantes : 


. o(0) —0 

. O(E)=E 

. Pour tous A,BC E, si A C B alors o(A) C o(B) 
. Pour tout AC E, o(A) CA 

. Pour tout A CE, o(o(A)) = o(A) 


OU OR & D 


Preuve : Les propriétés [1] P] G]sont des conséquences immédiates de la définition de 
l’origine. 

Soit a € o(A). Tout successeur de a est dans À. Puisque R est reflexive, a est son 
propre successeur, donc a € À, ce qui prouve] 

Prouvons la propriété Pl D’après la propriété précédente, o(o(A)) € o(A). Il suffit 
donc de prouver que o(A) € o(o(A)). 

Soit a € o(A). Tous les successeurs de a sont éléments de À. Soit b un successeur 
de a. Tout successeur de b est, par transitivité de R, aussi un successeur de a donc un 
élément de À. Par suite b € o(A). Donc tous les successeurs de a sont dans o(A). Et par 
conséquent a € o(o(A)) 


Lemme 2.2 (Préordre et topologie associée) 

Soit (E,R) un préordre. 

Soit T l’ensemble des sous-ensembles À C E tel que o(A) = À. (E,T) est la topo- 
logie d’Alexandroff associée au préordre. 

La topologie associée au préordre vérifie que pour tout À C E, o(A) — i(A). 


Preuve : D’après les propriétés de o, l’ensemble vide et E sont des éléments de T. 

Montrons que l’union d’un ensemble d’éléments de Test aussi un élément de T. 
Soit S un sous-ensemble de T. Montrons que o([JS) — US. D’après les propriétés de 
o, on sait que o([UJS) € US. Il suffit donc de montrer l’inclusion inverse. Soit a € US. 
Il existe À € S tel que a € À. Puisque À est élément de T, o(A) — À, donc tous les 
successeurs de a sont dans À, donc dans [JS. Par suite a € o(US). 

Montrons que l'intersection d’un ensemble d’éléments de Test aussi un élément 
de T. Soit S un sous-ensemble de T. Montrons que o(fS) = NS. Comme ci-dessus, 
il suffit de montrer que NS € o(NS). Soit a € MS. Pour tout À € S, a € A. Puisque S 
est sous-ensemble de T, pour tout À € S, a € o(A). Donc pour tout À € S, pour tout 
b successeur de a, on a b € A. Par suite pour tout b successeur de a, pour tout A ES, 
b € A. Par conséquent tous les successeurs de a sont éléments de NS, donc a € o(fS). 

Nous venons de prouver que (E,T) est une topologie d’Alexandroff. 

Puisque (E,T) est une topologie, les éléments de T sont appelés des ouverts. Soit 
A un sous-ensemble de E. On rappelle que o(A), l’origine de À est l’ensemble des 
éléments de E dont tous les successeurs sont dans À et que i(A), l’intérieur de À est le 
plus grand ouvert inclus dans A. Montrons que l’intérieur et l’origine d’un ensemble 
sont identiques. 

D’après les propriétés de o, o(o(A)) = o(A) et o(A) C À, donc o(A) est un ouvert 
inclus dans À. Par suite o(A) C i(A). 

Supposons que o(A) n’est pas égal à i(A), donc n’est pas le plus grand ouvert inclus 
dans À. Il existerait un ouvert B tel que o(A) CBC AetB # o(A). Puisque B C À, par 
monotonie de o, o(B) C o(A). Puisque B est un ouvert, o(B) — B donc B C o(A) et par 
suite B — o(A). Par suite o(A) = i(A). 


Lemme 2.3 (De Kripke vers Tarski) 

Soit I = (E,R,v) une interprétation de Kripke. 

Soit (ET) la topologie associée au préordre (E,R) et J = (E,T,v) l'interprétation 
de Tarski associée à I. Pour toute formule A, vk (A) = v4 (A). 


Preuve : Le lemme est prouvé par récurrence sur l’ensemble des formules. Il est la 
conséquence immédiate de ce que, d’après pour tout À C E, on à o(A) — i(A) 
où o(À) est l’origine de À pour le préordre (E,R) et i(A) est l’intérieur de À pour la 
topologie (E,T) associée au préordre. 


2.2 Espace topologique et préordre associée 


Définition 2.4 (Topologie et préordre associée) 
Soit (E,T) une topologie. Soit R la relation sur E ainsi définie : soient e,f EE, 
eRf si et seulement pour tout ouvert À ET, sie € À alors f € A. 


D'après cette définition, il est évident R est une relation réflexive et transitive donc 
que (E,R) est un préordre, le préordre associé à la topologie. 


Lemme 2.5 
Soit (E,T) une topologie d’Alexandroff et (E,R) le préordre qui lui est associé. 
Pour tout À sous-ensemble de E, on a o(A) = i(A). 


Preuve : Soit (E,T) une topologie d’Alexandroff et (E,R) le préordre qui lui est asso- 
cié. 

Soit (E,T') la topologie associée à ce préordre. Nous avons vu dans le lemme 
B-2Jaue (E,T") est une topologie d’Alexandroff et que pour tout À C E, o(x r)(A) = 
Ier) (A). 

Dans l’article de wikipédia lhttps://fr.wikipedia.org/wiki/Topologie_d’ 
il est indiqué, que si (E,T) est une topologie, alors la topologie (E,T') 
est plus fine que (E,T), autrement dit T C T'et que si (E,T ) est une topologie d’Alexan- 
droff, alors T = T'. 

Par suite pour tout À C E, og r)(A) = igr)(A), autrement dit l’intérieur d’un 
ensemble est égal à l’origine de l’ensemble pour le préordre associée à la topologie 
d’Alexandroff. 


Lemme 2.6 (De Tarski vers Kripke) 

Soit I = (E,T,v) une interprétation de Tarski. 

Soit (E,R) le préordre associée à la topologie d'Alexandroff (E,T) et soit J = 
(E,R, v) l'interprétation de Kripke associée à I. Pour toute formule À, vr(A) = v4(A). 


Preuve : Le lemme est prouvé par récurrence sur l’ensemble des formules. Il est la 
conséquence immédiate de ce que, d’après Pl] pour tout À C E, on a o(A) = i(A), où 
i(A) est l’intérieur de À, et o(A) l’origine de À pour le préordre associé à la topologie. 


Théorème 2.7 Une formule est Kripke-valide si et seulement si elle est Tarski-valide. 


Preuve : Montrons qu’une formule Kripke-valide est Tarski-valide. 

Supposons au contraire qu’il y a une formule À qui n’est pas Tarski-valide. Il existe 
une interprétation 1 = (E,T,v) de Tarski telle que v4(A) Z E. Soit (E,R) le préordre 
associé à la topologie d’Alexandroff (E,T) et J = (E,R,v) l'interprétation de Kripke. 
D’après le lemmeb.6] v£(A) ZE. Donc À n’est pas Kripke valide. 

Réciproquement toute formule Tarski-valide est Kripke-valide. 

Supposons au contraire qu’il y a une formule À qui n’est pas Kripke-valide. Il existe 
une interprétation / = (E,R, v) de Kripke telle que v4 (A) £ E. Soit (E,T) la topologie 
d’Alexandroff associée au préordre (E,T) et J = (E,T,v) l'interprétation de Tarski. 
D’après le lemmeP.3] vr (A) £ E. Donc À n’est pas Kripke valide. 
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Introduction 


Le terme «langage» désigne d’une part les langues naturelles - sous leur forme parlée et écrite, d’autre part les 
systèmes de notations - les formalismes - utilisés dans diverses sciences comme les mathématiques, la logique, la 
chimie, etc. et en particulier en informatique ( les langages de programmation par exemple). Tout langage comprend 
un ensemble d’objets élémentaires, que l’on peut composer pour constituer des unités qui ont un sens. La composition 
des objets élémentaires est le plus souvent un simple enchaînement linéaire (une concaténation) ; les unités qui ont un 
sens sont alors des suites finies d’objets élémentaires. Cette propriété pour un même langage peut se répéter à plusieurs 
niveaux. Ainsi dans une langue naturelle écrite, un mot est une suite de lettres (niveau lexical) ; une phrase est une 
suite de mots (niveau syntaxique) ; un texte est une suite de phrases (niveau du discours). 

La définition d’un langage à un niveau donné est la définition 


1. de l’ensemble des objets élémentaires (le «vocabulaire» ou l’«alphabet»> du langage du niveau considéré) 
2. de l’ensemble des suites d’objets élémentaires ayant un sens (la «syntaxe») 


3. des sens de ces suites (la «sémantique»). La définition d’un langage utilise elle-même un langage (souvent 
appelé «métalangage»), qui peut être une langue naturelle ou un formalisme. Le langage défini est parfois utilisé 
comme métalangage. 


Exemple 1  : le français écrit. 

Niveau lexical (ou lexicographique) : les objets élémentaires sont les lettres de l’alphabet, les unités ayant un sens 
des mots. Un dictionnaire comme le Robert donne une définition lexicographique de français : énumération des mots, 
définition - en français - des sens de chaque mot. Un dictionnaire français-anglais donne aussi une définition lex- 
icographique du français, les sens des mots français étant définis par leurs traductions en anglais. Au niveau mor- 
phologique, les mots sont considérés comme des suites d’objets élémentaires qui sont eux-mêmes des suites de lettres 
appartenant à des catégories grammaticales comme préfixe, suffixe, racine, désinence, etc. 

Niveau syntaxique : les objets élémentaires sont les mots et les signes de ponctuation, les unités ayant un sens les 
phrases. Une grammaire comme le «bon usage» de Grevisse donne une définition du français au niveau syntaxique : 
elle définit les phrases correctes et leur sens au moyen de règles exprimées en français, avec des termes techniques 
comme «adjectif», «substantif», «masculin», «subordonnée», «relative», etc. La définition des phrases correctes sans 
référence à leurs sens constitue l’aspect formel (ou syntaxique proprement dit) de la grammaire. 

La définition du sens des phrases constitue la sémantique. Notons qu’au niveau syntaxique les objets élémentaires 
(les mots) ont un sens, et que le sens d’une phrase est fonction du sens des mots qui la composent. Il en est de même 
au niveau morphologique, où le sens d’un mot est fonction des sens des objets élémentaires (préfixes, racines,etc) qui 
le composent. Par contre au niveau lexical, les lettres n’ont pas de sens, et le sens d’un mot est arbitraire. 


Exemple 2  : le français parlé. 

Un mot (ou une phrase) prononcé est une suite continue de sons. L’alphabet phonétique définit un ensemble de nota- 
tions de sons élémentaires tel que l’on puisse considérer tout mot (ou toute phrase) prononcé comme une suite discrète 
de tels objets élémentaires. 


Exemple 3  : un langage de programmation (Ada, C, Java, etc.) 
Les objets élémentaires sont les symboles de base (lettres de l’alphabet, chiffres, caractères spéciaux) dont la liste 
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est donnée explicitement. Les unités ayant un sens sont les programmes. Ceux-ci sont définis par des diagrammes 
syntaxiques (ou des formes normales de Backus) complétées par des conditions supplémentaires (par exemple sur 
les déclarations des identificateurs) qui sont souvent exprimées en langue naturelle. Le sens des programme est lui 
aussi souvent défini en langue naturelle. Une telle définition est un mélange de définitions formelles (les diagrammes 
syntaxiques) et de définitions informelles (les paragraphes en langue naturelle). On peut aussi donner des définitions 
formelles (c’est-à-dire n’utilisant pas la langue naturelle) des langages de programmation. Par exemple le sens d’un 
programme peut-être défini en lui associant une formule mathématique définisssant la fonction qu’il calcule, ou un 
programme équivalent dans un autre langage de programmation - ainsi un compilateur définit le sens d’un programme 
par traduction dans un langage machine. On peut encore définir formellement la sémantique d’un langage au moyen 
d’un interpréteur de ce langage, le sens d’un programme est alors l’ensemble de ses exécutions pour toutes les données 
possibles. L’interpréteur est un programme qui peut être écrit dans un autre langage de programmation ou dans le 
langage défini. 


Notons que le mot «formel» signifie couramment «exprimé en langage mathématique», ou plus généralement «ex- 
primé dans un formalisme» (c’est-à-dire dans un langage artificiel rigoureusement défini), «informel» signifiant «ex- 
primé en langue naturelle» (c’est ainsi qu’il faut comprendre les termes «définition formelle», «définition informelle») ; 
cependant on entend par langage formel un langage considéré comme un ensemble de suites d’objets élémentaires, ab- 
straction faite du sens de ces suites. Cet aspect formel de la définition d’un langage est aussi appelé aspect syntaxique 
et doit être complété par la définition du sens des unités du langage, ce qui constitue l’aspect sémantique. 


L'objet de ce cours est l’étude de formalismes utilisés pour la définition syntaxiques de langages artificiels comme 
les langages de programmation ou les systèmes de notations mathématiques et logiques. Ces formalismes sont aussi 
utilisés pour étudier les langues naturelles, mais ces applications ne seront pas développées. 

La première partie de ce polycopié est une introduction à la théorie des langages formels. Un langage formel est 
un ensemble de suites d’objets élémentaires, qui selon le langage défini, et le niveau auquel on se place, peuvent être 
des lettres, des mots, des symboles, des caractères, etc. Tous ces ensembles d’objet élémentaires ont en commun le fait 
d’être finis, et sont appelés vocabulaire (ou alphabet). Un langage formel est un ensemble de suites finies (de chaînes) 
d’éléments de son vocabulaire. Les opérations de base sur les chaînes et les langages sont définies au chapitre [I] où 
sont aussi données des propriétés élémentaires de la notion de relation, qui joue un rôle important dans la suite. La 
notion de langage comme ensemble de chaînes est trop générale : un langage doit de plus satisfaire des conditions 
d’effectivité pour pouvoir être traité par des machines physiques (cas des langages de programmation), ou abstraite 
(cas des systèmes de notations logiques), ou être compris et énoncé par une personne (cas des langues naturelles, des 
systèmes de notations mathématiques, des langages de programmation évolués, etc). La notion de système de réécriture 
est la notion de base pour la définition des machines abstraites comme les machines de Turing, et des automates et des 
grammaires utilisés pour la reconnaissance et la génération des langages formels (chapitre). Les grammaires les plus 
utilisées sont les grammaires hors-contexte, qui sont étudiées au chapitre [M] On étudie ensuite (chapitres IV, V, VD) les 
automates finis et les langages réguliers. 

La deuxième partie (chapitre VII : définition d’ensembles par récurrence) comprend une étude des théorèmes 
du point fixe qui sont à la base de telles définitions et une étude des systèmes d’équations définissant les langages 
hors-contexte. 

La troisième partie (compléments sur les langages hors-contexte), comprend une étude des grammaires hors- 
contexte et de leurs formes normales (chapitre VIIT), une étude de propriétés importantes des langages hors-contextes 
(chapitre IX), et une étude des automates à pile, qui sont les automates associés aux grammaires hors-contextes 
(chapitre X). 

La quatrième partie (/ntroduction à la théorie de la calculabilité) comprend un chapitre où sont définies les ma- 
chines de Turing et démontrées leurs propriétés de base (chapitre XT), et un chapitre consacré aux problèmes de 
décision pour les langages hors-contextes et les langages récursivement énumérables (chapitre XIT). 


Chapitre I 


Langages, relations 


1 Chaînes et langages 


1.1 Vocabulaire 


On appelle vocabulaire (ou alphabet) un ensemble fini quelconque. Les éléments d’un vocabulaire sont appelés 
lettres, caractères ou symboles. On note #V le nombre d’éléments d’un vocabulaire V. 


1.2 Chaîne 
1.2.1 Définition 


On appelle chaîne (ou mot, ou phrase) sur un vocabulaire V toute suite finie a; ,a2,...,a, d'éléments de V. On note 
usuellement une chaîne en écrivant en séquence, sans séparateur, les lettres qui la composent. 


Exemple 1.1 aba est une chaîne sur le vocabulaire {a, b}. 
débutx := lfin est une chaîne sur le vocabulaire {début, fin, :=, 1, x}, qu'il est préférable d'écrire en utilisant l’espace 
comme séparateur : début x := I fin. 


Remarque 1.1 Un vocabulaire V peut être un ensemble fini de chaînes, comme dans le second exemple ci-dessus. 
L'écriture des chaînes sur V sans séparateurs entre les éléments de V peut alors produire des ambiguiïtés. Par exemple, 
si V = {a, aa}, il faut un séparateur pour distinguer les deux chaînes a,aa et aa,a. 


1.2.2 Longueur d’une chaîne 


On appelle longueur d’une chaîne le nombre d’éléments de la suite la définissant. La longueur d’une chaîne x sera 
notée |x|. 

Avec les exemples ci-dessus, on a : | aba | = 3 et | début x := 1 finl=S5. 

Par convention, il existe une chaîne de longueur 0, la chaîne vide, notée &. 

Etant donné un vocabulaire V, on note V”", où n est un entier positif ou nul, l’ensemble des chaînes sur V de 
longueur n. On a les propriétés suivantes : 

— V0 = {e} : la chaîne vide est une chaîne sur tout vocabulaire. 

— VI =V : les chaînes de longueur 1 sont identifiées aux lettres. 


Exercice 1.1 Montrer que si V Æ 0, V" comprend (#V }" éléments. 


1.2.3 Ensemble des chaînes sur un vocabulaire 


Etant donné un vocabulaire V, on note V* l’ensemble des chaînes sur V, et V * l’ensemble des chaînes non vides 
sur V. Autrement dit, V* =U;-0V'etV*=(U;oV'. 


Propriété 1.1 
— SiV Æ0 alors V* est infini. 
— 0 = {e}. 


1.3 Sous-chaîne 


Etant donné une chaîne w sur un vocabulaire V, une chaîne w est une sous-chaîne de w s’il existe x, y € V* tels que 
w = xuy. La sous-chaîne u est un préfixe de w si x — € ; un suffixe de w si y — €. 


Exemple 1.2 La chaîne abba admet les sous-chaînes £, a, b, ab, bb, ba, abb, bba, abba. Il existe deux occurrences de 
chacune des sous-chaînes a et b. Les préfixes de abba sont &, a, ab, abb et abba ; ses suffixes sont &, a, ba, bba et abba. 


Exercice 1.2 


1. Déterminer les nombres maximal et minimal de sous-chaînes, de préfixes et de suffixes d’une chaîne de longueur 
donnée. 


2. Montrer que toute chaîne sur {a, b}, de longueur supérieure ou égale à 4, admet deux occurrences consécutives 
d’une même sous-chaîne non vide. 


1.4 Concaténation 


La concaténation est l’opération qui associe à deux chaînes x et y la chaîne notée x.y ou xy définie par : 
SiX— 4j1,42,...,4n et y = b1,b2,...,b, alors x.y = C1,C2,...,Cn+p, 
avec c; =a;pouri=1l,...netc,,; =b;pouri=1,...p. 
Par exemple, la concaténation des chaînes aba et cab donne la chaîne abacab. 
On vérifie facilement que la concaténation est une opération associative admettant la chaîne vide comme élément 
neutre. Soit : 
— Vx,y,z EV*x.(y.z) = (x.y).z 
— VxE V'xE=Ex=x. 


1.5 Monoïde 


On appelle monoïde un ensemble muni d’une opération associative admettant un élément neutre. Un monoïde est 
représenté par un triplet < E,.,i >, où E est l’ensemble considéré, ”./ est l’opération associative sur E etie E est 
l’élément neutre de cette opération. 

Pour tout vocabulaire V, < V*,.,£ > est donc un monoïde. 
Comme exemple d’autres monoïdes, citons < N,+,0 > et < N,.,1 >, où + et. dénotent respectivement l’addition et 
la multiplication des entiers. 


1.6 Monoïde libre 
1.6.1 Définition 


Soit V un vocabulaire quelconque. Le monoïde V* possède les deux propriétés suivantes : 
1. tout élément de V* est une suite d’éléments de V 


2. deux suites distinctes d’éléments de V définissent deux éléments distincts de V*. 


10 


La propriétéll|distingue le monoïde V* par exemple du monoïde (VU {a})*, avec a & V. 

La propriété |2| distingue le monoïde {a,b}* par exemple du monoïde commutatif M obtenu en postulant que 
l’opération de concaténation est commutative : les deux suites ab et ba d’éléments de V définissent alors le même 
élément de M. 

V* est le seul monoïde satisfaisant les propriétés [T]et [2]: on dit que V* est le monoïde libre sur V. 


1.6.2 Homomorphisme de monoïdes 


SoitM—<E,.i>etM'—<E',.,i > deux monoïdes. On appelle homomorphisme de M dans M’ toute application 
h de E dans E" telle que : 

— h{i)=i 

- Vx,yEE,h(x.y) = h(x).h(y) . 

Un isomorphisme de monoïdes est un homomorphisme bijectif de monoïdes. Si h est un homomorphisme de V* 
dans un monoïde quelconque M, alors h est défini par sa valeur pour chaque lettre a de V. En d’autres termes, si h 
et h’ sont deux homomorphismes de V* dans M tel que Va € V,h(a) = h'(a), h et h sont identiques. Il en résulte 
immédiatement la propriété suivante : 


Propriété 1.2 Soit M un monoïde quelconque et f une application d’un vocabulaire V dans M. Alors il existe un 
homomorphisme unique h de V* dans M qui prolonge f, c'est-à-dire tel que Va € V,h(a) = f(a). 


1.6.3 Unicité du monoïde libre 


Considérons maintenant un monoïde L satisfaisant la propriété P suivante : 
soit M un monoïde quelconque et f une application d’un vocabulaire V dans M ; alors il existe une application 
injective i de V dans L et un homomorphisme unique h de L dans M tel que Va € V,h{i(a)) = f(a). 
L'application i définit une représentation des lettres de V par des éléments de L et l’'homomorphisme h étend à tous les 
éléments de L l’application f. 
On peut montrer que deux monoïdes satisfaisant la propriété P sont isomorphes. 
Le monoïde V* satisfait la propriété P et tout monoïde L satisfaisant P est alors isomorphe à V*. On peut donc utiliser 
la propriété P pour donner une définition algébrique de la notion de monoïde libre sur un vocabulaire V. Cette notion 
est alors définie à un isomorphisme près (c’est-à-dire à la représentation près des chaînes sur V ; ceci était implicite 
dans la première définition). 


Exercice 1.3 Montrer que l’application «longueur d’une chaîne» est un homomorphisme de monoïde de < V*,.,£ > 
dans < N,+,0 >. 

Cette application est un isomorphisme si #V = 1 : si V ne contient qu’un élément, < N,+,0 > est le monoïde libre sur 
V car on peut alors représenter sans ambiguïté les chaînes sur V par leurs longueurs. 


1.7 Élévation à la puissance 


On pose, pour toute chaîne x sur un vocabulaire V, 

es 

— pour tout entier ñn > 0,x"= xx" = x.x...x avec n facteurs. 
Comme pour tout monoïde multiplicatif, on a pour tout n,m les propriétés : 

…. xt = x! x 


jm — (ui 


il 


18 Langage 


On appelle langage sur un vocabulaire V tout sous-ensemble de V*. 


Exemple 1.3 
— Un langage de programmation est un langage sur l’ensemble de ses symboles de base. 
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— L'ensemble des phrases de la langue française est un langage sur l’ensemble des mots du français ; l’ensemble 
des mots du français est lui-même un langage sur l’ensemble des lettres de l’alphabet. 

— L'ensemble des identificateurs est un langage sur {A,B,...,Z,a,b,...,z,0,1,...,9}. 

— 0,V!,V2,...,V",V* sont des langages sur V. On appelle 0 le langage vide. 


Un langage est dit fini ou infini selon qu’il comprend un nombre fini ou infini de chaînes. 


Propriété 1.3 Un langage L est infini si et seulement si pour tout n € N, il existe x € L tel que |x| > n. 
Soit encore, de façon équivalente : un langage L est fini si et seulement si il existe une borne à la longueur des chaînes 
de L. 


Cette propriété résulte immédiatement de ce que tout vocabulaire est un ensemble fini. 


Exemple 1.4 Le langage des identificateurs de Java est infini car il n’y a pas, dans la définition de Java, de borne 
pour la longueur des identificateurs. 


1.9 Opérations sur les langages 
1.9.1 Opérations ensemblistes 


Les langages sur V étant les parties de V*, on définit de la manière usuelle la réunion Li UL), l'intersection Li NL, 
la différence Li — L et le complémentaire L = V* — L de langages Li, L et L sur V. 


1.9.2 Concaténation et concaténation itérée 


On étend aux langages la concaténation définie pour les chaînes en posant pour tous langages L1, LA sur V : 
LIL2={xy|xeL,yEL} 
Exemple 1.5 Si Li = {a"b"|n > 0} et La = {c"d"|n > 0} alors Li.Li = {aPbPc4d1|p,q > 0}. 


La concaténation des langages est associative et admet le langage {£} comme élément neutre. 
Autrement dit < P(V*),.,{£} > est un monoïde. 


Exercice 1.4 
1. Prouver que, pour tout LE V*, O.L = L.0 — 0. 
2. Etudier le monoïde < P(V*),.,{e} > quand V = 0. 


Remarque 1.2 1! ne faut pas confondre le langage vide @, qui ne contient aucune chaîne, avec le langage {e}, qui 
contient la chaîne vide &. Le premier est l'élément absorbant et le second est l'élément neutre de la concaténation des 
langages. 


L’élévation à une puissance entière d’un langage L est définie comme pour tout monoïde multiplicatif : 
_ L0={e} 
— pour tout n > 0,L" = L.L"-| = L.L...L avec n facteurs. 
On définit enfin les opérations de concaténation itérée * et + par : L* =U;.0Li et Lt =U;-0Li. 
On identifie souvent, quand il n’y a pas d’ambiguïté possible, les langages sur V ne comprenant qu’une seule chaîne 
avec les chaînes de V*. 
On écrit alors par exemple a* pour {a}* ete pour {e}. 


Quand le langage L est fini, il peut être considéré comme un vocabulaire. Les notations L', L* et L* sont alors 
ambiguës : elles désignent aussi, respectivement, les chaînes sur L de longueur n, l’ensemble des chaînes sur L et 
l’ensemble des chaînes non vides sur L (voir les paragraphes [L2.2/et[1.2.3). Par exemple, si L= {a,aa}, L? est d’une 
part le langage qui est la concaténation de L à lui-même, d’autre part l’ensemble des chaînes de longueur 2 sur L. Dans 
le premier cas, on a L? — {aa, aaa,aaaa}, dans le second cas L? — {a.a,a.aa,aa.a,aa.aa}. 
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1.9.3 Expressions régulières 


On appelle expression régulière sur un vocabulaire V une expression dont les opérandes sont des lettres de V ou 
le symbole @ et les opérateurs sont pris dans l’ensemble {+,.,*}, où + et . sont binaires et + est unaire. On écrit 
usuellement une expression régulière avec les conventions suivantes : 

— on utilise la notation infixée pour les opérateurs binaires + et ., la notation en exposant pour l’opérateur unaire 

*% 

— les priorités des opérateurs sont dans l’ordre : *,.,+. 

Une expression régulière définit un langage sur V quand on identifie chaque lettre a de V au langage {a}, 0 au langage 
vide et que l’on interprète + comme la réunion, . comme la concaténation des langages et x comme la concaténation 
itérée définie en[l.9.2] On dit encore que le langage ainsi défini est la valeur de l’expression régulière. 

On appelle /angage régulier tout langage qui peut être défini par une expression régulière. En particulier tout langage 
fini est régulier. 


Exemple 1.6 


1. (A+B+...+Z+a+b+...+2) (A+B+...+Z+a+b+...+24+0+1+...+9)* est une expression régulière 
définissant le langage des identificateurs de Java. 


2. 0* est une expression régulière définissant le langage {e}. 


Exercice 1.5 


1. Montrer que l’ensemble des langages réguliers sur un vocabulaire V est le plus petit ensemble de langages 
contenant les langages finis sur V et fermé pour la réunion, la concaténation et l'opération étoile. 


2. Soit L un langage sur un vocabulaire V. Montrer que L” est le plus petit langage sur V contenant L et &, fermé 
pour la concaténation. 


3. Montrer que les égalités suivantes sont vraies pour tout langage L : 


— (e+L)* =L* 
- EL = LI 


4. Montrer que, pour tout langage L,M,N et P, si LCMet NC P, alors L* C M* et L.N C M.P (en d’autres 
termes, l’étoile et la concaténation sont des opérations croissantes.) 


5. Montrer que les égalités suivantes sont vraies pour tous langages L et M : 
- (* M) = (L+M) 
— (LM)L = L(M.L)" 
- (LM+L)".L=L(ML+L) 
Montrer que l'égalité suivante n'est pas valide : (L+M)* = L*+M* 


6. Soit L et M deux langages sur un vocabulaire V, X une inconnue à valeur dans l’ensemble des langages sur V. 
(a) Montrer que l'équation L.X = M n'admet pas nécessairement une solution. 
(b) Montrer que l'équation X = L.X + M admet toujours une solution. 
(c) Donner des exemples de langages L et M tels que l'équation X = L.X + M admet plusieurs solutions. 
(d) Reprendre les questions [6b|etfcavec l’équation X = X.L+M. 
7. Combinatoire de mots 


(a) Soit V un vocabulaire non vide, x et y deux mots sur V tels que xy = yx. Montrer qu'il existe u € V* et 
deux entiers p > 0 et q > O tels que x = up et y = uw‘. 


(b) Soit x,z € V*, y € V* tels que xy = yz. Montrer qu'il existe deux mots sur V, u, v et un entier p > O tels 
que x = uv, z = vu et y = (uv)Pu = u(vu)P. 


8. Soit V = {0,1}. Donner des expressions régulières sur V définissant les langages suivants : 
(a) L'ensemble des chaînes sur V contenant au moins une occurrence de 0. 


(b) L'ensemble des chaînes sur V de longueur impaire. 
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(c) L'ensemble des chaînes sur V ne contenant pas deux occurrences consécutives de 0, ni deux occurrences 
consécutives de 1. 


9. Soit l'opération — définie sur V* par : 
— ET =E 
- Vae V,wEe V*,(a.w)" = wT.a 


(a) Prouver que Vx,y € V*,(xy)7 = y x" 
(b) Prouver que Vw € V*,(w°)T =w 
(c) Soit @ l'opération sur V* définie par : Vx,y € V*,x@y= y.x 
— Montrer que < V*,®,E > est un monoïde. 
— Montrer que l’opération = est l’homomorphisme de < V*,.,£ > dans < V*,@,£ > qui étend l’applica- 
tion identique de V dans V. 
— Montrer que < V*,®,e > et < V*,.,£ > sont isomorphes. Ainsi < V*,®,E > est, au même titre que 
< V*,.,E >, le monoïde libre sur V : on peut écrire indifféremment les chaînes de gauche à droite ou de 
droite à gauche. 


(d) Etendre l'opération < aux langages sur V. 
(e) Prouver que, pour tout langage L sur V, si L est régulier, alors L” est régulier 


(f) On appelle palindrome sur V toute chaîne w sur V telle que w°® = w. Soit P le langage des palindromes 
sur V. Montrer que : P= {ww |weVx}U{waw"|w e V*,ae V}. 


2 Relations 


2.1 Définition 


On appelle relation (binaire) sur un ensemble E toute partie de E x E. Etant donné une relation p sur E et deux 
éléments x et y de E, on dit que p est vraie pour le couple (x, y) si et seulement si (x,y) € p. Dans la suite, on écrira 
souvent xpy pour (x, y) € P. 


Exemple 2.1 Pour tout ensemble E, © est la relation partout fausse, E x E est la relation partout vraie sur E. On note 
1£, out s'il n’y a pas d’ambiguïté, la relation identité sur E, c’est-à-dire la partie de E X E définie par : 
1= {(x,x)lx € E}. La relation 1 est aussi notée par le symbole =. 


On dit qu’une relation p sur E est réflexive si Vx € E,xpx; qu’elle est transitive si Vx,y,z € E, xpy et ypz impliquent 
XPZ. 

Une relation réflexive et transitive est dite relation de préordre. 

Une relation p sur E est symétrique si Vx,y € E, xpy implique ypx; antisymétrique si Vx,y € E, xpy et ypx impliquent 
X =}. 

Une relation de préordre symétrique est dite relation d'équivalence ; une relation de préordre antisymétrique est dite 
relation d'ordre partiel ; une relation d’ordre (total) est une relation d’ordre partiel telle que Vx, y € E, xpy ou ypx. 
Une relation fonctionnelle sur E (ou fonction partielle de E dans E) est une relation p sur E telle que Vx,yE E, xpy 
et xpz impliquent y — z ; une fonction totale (une application) de E dans E est une relation fonctionnelle p sur E telle 
que pour tout x de E il existe un y de E tel que xpy. 


2.2 Opérations sur les relations 
2.2.1 Opérations ensemblistes 


Les relations étant les parties de E x E, on définit de la manière usuelle le complémentaire P, la réunion pU6 et 
l'intersection p No de relations p et 6 sur E. On a: 

— (x,y) € pUo si et seulement si xpy ou xoy 

— (x,y) € pNo si et seulement si xpy et xoy 
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— xpy si et seulement si (x,y) & p c’est-à-dire non xpy 
Etant donné deux relations p et 6 sur Æ, on dit que p implique © (que © contient p ) si et seulement si p € ©, c’est-à- 
dire si et seulement si pour tout x et y de E, xpy implique xoy. 
On vérifie facilement que p implique © si et seulement ss PUÜG=EXE. 


2.2.2 Composition des relations 


La composition des relations sur E est l’opération sur P(E x E) définie par : 
Vp,6E P(EXE),p6={(xy)EEXE|LEE,(x,z) Epet(z,y) eo}. 

La composition des relations est associative et admet comme élément neutre la relation identité 1. Autrement dit, 
<®P(EXE),.,1> est un monoïde. 


Exercice 2.1 Montrer qu'une relation p sur E est transitive si et seulement si p.p € P. 


On définit pour toute relation p sur E et tout entier n > 0 la relation p” , comme pour tout monoïde multiplicatif, 
par : 


= po=1 
= Vn > 0,p" = pp"! 
On vérifie immédiatement que, pour tout n > 0, xp” y si et seulement si il existe une suite x1,...,x,+1 d'éléments de E 


tels que x1 = x,x,11 = y et pour tout à, 1 <i<n,xipxir1. 
On définit enfin pour toute relation p les relations p* et p* par: 
p=(Up'etp*=([Jp" 
n>0 n>0 


Il est clair que : 
— xp*y si et seulement si x = y ou xp*y 
— xp*y si et seulement si il existe un entier n > 0 et une suite x1,...,x1+1 d'éléments de E tels que x1 =x,xy11 = 
et pour tout à, L <i<n,xipxir] 


2.2.3 Fermeture transitive d’une relation 


On appelle fermeture transitive d’une relation p sur E la plus petite relation transitive sur E contenant p, c’est-à-dire 
la relation sur E qui contient p, qui est transitive et qui est incluse dans toute relation transitive contenant p. 


Proposition 2.1 Pour toute relation p sur un ensemble E, p* est la fermeture transitive de p . 


Preuve : Il est clair que p* est transitive. Soit maintenant 6 une relation transitive contenant p. Si xp*y , alors il existe 
X2,...,Xn, aVec ñn > 0, tels que xpx2...x,py. Comme © contient p, on a x6x2...x,6y et, G étant transitive,xGy. 


On appelle fermeture transitive et réflexive d’une relation p la plus petite relation transitive et réflexive contenant P. 


Proposition 2.2 Pour toute relation p sur un ensemble E, p* est la fermeture transitive et réflexive de p. 


Preuve : exercice. 


Exercice 2.2 


1. Soit p la relation sur l’ensemble { 1, 2, 3, 4, 5, 6} définie par le graphe de la figure ci-dessous. Tracer les graphes 
des relation p* et p*. 


1 


TN, 
VIN, 


2. Définir un algorithme qui, étant donné une relation sur un ensemble fini, calcule sa fermeture transitive. 


3 
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Chapitre II 


Systèmes de réécriture, Grammaires 


1 Définitions des langages 


On définit couramment un langage, c’est-à-dire un ensemble de chaînes sur un vocabulaire V, par une expression 
du type {x € V* | P(x)}, où P est une propriété des chaînes sur V. 

Par exemple {x | n € N,x = a"b'}, c’est-à-dire {a"b" | n > 0}; {x | x = ab ou x = cd}, c’est-à-dire {ab,cd} ; 
{x | x appartient au langage défini par l’expression régulière a(a + b)*}, que l’on note simplement a(a +b)*. 


Certaines définitions permettent de construire un algorithme de reconnaissance du langage défini, c’est-à-dire un 
algorithme distinguant les chaînes du langage défini des autres chaînes sur le vocabulaire. Plus précisément, ces défini- 
tions appartiennent à une classe de définitions qui peuvent être traduites (compilées) en algorithmes de reconnaissance 
du langage défini. C’est le cas de toute définition d’un langage fini par la donnée explicite de ses chaînes : on peut alors 
construire une table des éléments du langage. C’est encore le cas de toute définition d’un langage par une expression 
régulière : il est en effet possible de construire à partir de toute expression régulière un algorithme de reconnaissance 
du langage défini (voir le chapitre M. L'intérêt pratique de définitions de ce type est évident : le fait que l’on puisse 
déduire de manière systématique de la définition d’un langage de programmation un algorithme de reconnaissance 
des programmes facilite l’écriture de compilateurs pour ce langage. On étudiera dans la suite différentes classes de 
définitions de langages, que l’on peut traduire en algorithmes de reconnaissance des langages définis. Ces modes 
de définitions utilisent souvent la notion de système de réécriture, qui est introduite au paragraphe P] de ce chapitre. 
Les grammaires, introduites au paragraphe [3] utilisent un système de réécriture pour engendrer toutes les chaînes du 
langage défini à partir d’une chaîne donnée, l’axiome de la grammaire. Une autre classe de définitions de langages 
fondées sur des systèmes de réécriture est constituée par les automates et les machines, dont on verra des exemples au 
chapitre NV] On étudiera aussi des modes de définitions de langages qui n’utilisent pas de système de réécriture : on 
peut ainsi définir un langage comme la valeur d’une expression (par exemple d’une expression régulière), ou comme 
solution d’un système d’équations (voir le paragraphe du chapitre[V|et le chapitre Ex). 


2 Systèmes de réécriture 


2.1 Définition 


On appelle système de réécriture un couple S —< V,R > où : 


— V est un vocabulaire 
— Rest un ensemble fini de couples de chaînes sur V 


Tout élément (@,f) de R est appelé règle de réécriture et est noté à — $ ; & est la partie gauche, B la partie droite de 
la règle & — $. Des règles & — Bi, — B2,...,0 — By ayant même partie gauche sont souvent notées 


où — Bi | B2 |... | B. 
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2.2 Relations de dérivation dans un système de réécriture 


Etant donné un système de réécriture S —< V,R > et deux chaînes x et y de V*, x se réécrit directement y si et 
seulement si il existe une règle & — f dans R telle que x = uv, y — uBv. 

On dit encore que x se réécrit y par application de la règle & — f. La partie gauche @ de la règle appliquée est une 
sous-chaîne de x et y est obtenue à partir de x en remplaçant une occurrence de & dans x par la partie droite f. 

On note x se réécrit directement y par x =, y, ou x 8 y, ou encore, s’il n’y a pas d’ambiguïté sur le système de 
réécriture utilisé, x = y. 

Six 8 y, il est possible que plusieurs règles de R permettent de réécrire x en y. 
Par exemple, soit R — {ab — ba,aab — aba} : on a aab —R aba, par application de la première ou de la deuxième 
règle de R. Il est aussi possible qu’une même règle puisse s’appliquer à différentes sous-chaînes de x pour donner y; 
soit par exemple la règle a — aa : la chaîne aaa peut être obtenue en réécrivant la première ou la deuxième lettre de la 
chaîne aa. 

La relation — associée à un système de réécriture < V,R > est une relation sur V*, c’est-à-dire une partie de 
V* x V*. On définit comme pour toute relation (voir paragrapheP]du chapitre|I} les relations =", pour n entier positif 
ou nul, =* et =*. Pour tout x,y de V*, on a: 

— x =" y signifie : x se réécrit en y par application de n règles (en particulier, x =° y si et seulement si x — y) 

— x =* y signifie : x se réécrit y (par application d’un nombre quelconque, éventuellement nul, de règles) 

— x = ysignifie : x se réécrit y par application d’au moins une règle. 
On appelle dérivation dans un système de réécriture toute suite finie x1,x2,...,x4 de chaînes telles que k > 1 et x1 = 
X2 =... = x4. On dit que x# est dérivée à partir de x1 : x1 est l’origine, x4 est l’extrémité de la dérivation. La longueur 
de la dérivation est égale à k — 1, c’est-à-dire au nombre d’applications de règles de réécriture dans la dérivation. Les 
chaînes x; sont les éléments de la dérivation. On a évidemment : 

— x—=* y si et seulement si il existe une dérivation d’origine x et d’extrémité y. 

— x =" y si et seulement si il existe une dérivation de longueur n de x à y. 
La donnée d’une dérivation ne permet pas toujours de retrouver les règles de réécriture appliquées, ni les sous-chaînes 
réécrites (car la relation — ne le permet pas toujours). On introduit maintenant la notion de dérivation indicée, qui 
décrit complètement le processus de réécriture. Etant donné un entier i > 1 et une règle r, on note —;; la relation sur 
V* définie par : 
X—:; y Si et seulement si 

— X—=4]...4n, AVEC 41,...,4n E V, 

— r=d...a—O®@,1l1l<i<n+l,i-1<k<n 

— Y—4@d]...4dj-]04k+]...4n. 
L’entier à désigne le premier caractère de la sous-chaîne réécrite de x, et r la règle appliquée. 
On ak = i— 1 quand la partie gauche de la règle r est la chaîne vide et i — n + 1 quand la chaîne vide est réécrite © à 
droite de la chaîne x. 
Une dérivation indicée est une suite finie x1,< £1,r1 >,x2,< b2,r2 >,...,Xg 1, <ig_1,rg-1 >,Xg, telle que : 

— k>1,x1,...,xr € V*, 

— F1,...,/k_1 appartiennent à À 

— XL in A2 XL ip re À 
Comme ci-dessus, la dérivation est d’origine x1, d’extremité x, et de longueur k— 1. 
On associe ainsi à un système de réécriture quatre relations de dérivation : 

— A:x—* y (il existe une dérivation de x à y) 

— A:x—" y (il existe une dérivation de x à y de longueur n) 

— A3:x,X%2,...%,,y est une dérivation de x à y 

— A:x,< 1,71 >,2X2, < b2,72 >,...,Xn, <in,ln >,Y 6St une dérivation indicée de x à y. 
On a les propriétés suivantes : 

— À, s'écrit -n tel que A2 

— À) s'écrit 2x2,...x, tels que A3 

— A3 s'écrit h1,r1,...in,rn tels que A4 
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2.3 Exemples de systèmes de réécriture 

1. Vi = {a,b,0,1,r,s},R1 = {ra — s,rb —s, sa —s, sb — s, 50 — 5, s1 — s}. 
On vérifie facilement que pour tout w dans {a,b,0,1}*, on a rw =" s si et seulement si le premier caractère de 
w est a ou b. Ce système de réécriture reconnaît ainsi les identificateurs sur le vocabulaire {a,b,0,1}. 

2. Vi = {0,1,+,E},R1={E —0I|1|E+E)}. 
Pour tout w appartenant à {0,1,+}*, on a E —* w si et seulement si w est une expression construite avec les 
opérandes 0 et 1 et l’opérateur +. 

3. V3={0,1,+},R3 = {0+0—0,0+1—1,1+0—1,1+1—0}. 
Ce système de réécriture calcule la somme modulo 2 d’une suite d’entiers binaires en ce sens que si w appar- 
tenant à {0,1,+}"* est expression dérivée à partir de E dans le système de l’exemple précédent, on a dans R3 
la dérivation w —=* 0 ou w —=* 1 suivant la valeur de l’expression quand l’opérateur + est interprété comme 
l’addition modulo 2. 

4, Va = {0,1},R4 = {10 — 01}. 


Soit x € {0,1}* et soit y telle que a) x —=* y et b) la règle de R4 ne s’applique pas à y (en d’autres termes : y ne 
contient pas d’occurrence de 10). Alors y est la permutation des lettres de x où tous les 0 sont avant les 1. Ce 


système de réécriture trie donc les chaînes de {0, 1}* par chiffres croissants. 


2.4 Propriété (composition des dérivations) 


Soit S —< V,R > un système de réécriture. Soit u1,...,Un,v1,...,v, des chaînes de V*. 
AlOTS Si uj —* V1,... ,Un —* Vy, ON AU... Un > V1... Ve 
Cette propriété se démontre comme suit : 


1. siui —=* vi, on a alors uju2 =* viu (démonstration facile par récurrence sur la longueur de la dérivation). 
2. On a de même : si 2 —* v, alors vyu —=* vi. 
3. On en conclut que si uj =* vi et u2 —* v), alors uju2 —=* vivo. 


La généralisation au cas de n dérivations est immédiate. 

Nous énonçons la propriété avec la relation de dérivation A2 (c’est-à-dire =") : 
pour tout 41,...,Un,V1,...,VA appartenant à V*, pour tout g1,...,g, appartenant à N, 
Su 1 vi,...,Un 0% v, alors u1...uy =? vi...v,, avec p = EX? ,gq; 


Exercice 2.1 Enoncer la propriété de composition pour les relations de dérivation A3 et A4 (c’est-à-dire pour les 


dérivations et les dérivations indicées). La dérivation d’origine u1 ...u, et d'extrémité vi .…..v, est-elle unique ? 


3 Grammaires 


3.1 Définition 


On appelle grammaire tout quadruplet G —=< Vr,Vw,S,R > où 
— Vr et Vy sont deux vocabulaires disjoints. 


Vr est le vocabulaire terminal (ses éléments sont appelés symboles terminaux), Vy est le vocabulaire non- 


terminal (ses éléments sont les symboles non-terminaux). Les chaînes sur V7 sont dites chaînes terminales. 
On pose V = Vr UVy et V est appelé le vocabulaire de la grammaire. 

— S'est un élément de Vy, l’axiome de la grammaire. 

— < V,R > est un système de réécriture. R est l’ensemble des règles de la grammaire. 


3.2 Langage engendré par une grammaire 


On appelle langage engendré par une grammaire G —< Vr,Vy,S,R > l’ensemble des chaînes sur le vocabulaire 
terminal Vr que l’on peut dériver à partir de l’axiome S. On note L(G) le langage engendré par la grammaire G. On a 
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donc: L(G)={xe Vi |S = x}. 
Des exemples de grammaires sont donnés au paragraphe [3.4] 


Définition 3.1 Deux grammaires sont dites équivalentes si elles engendrent le même langage. 


3.3 Classification des grammaires 


En imposant des restrictions sur la forme des règles, on définit différents types de grammaires. 


3.3.1 Grammaires générales (de type 0) 

Une grammaire est dite générale si toutes ses règles sont de la forme : 
a — B, avec af € V*,et a ZE. 
3.3.2 Grammaires sous-contexte (de type 1) 


Une grammaire est dite sous-contexte si toutes ses règles sont de la forme : 
AB — af, avec à, € V*, A € Vy, DE V*. 


3.3.3 Grammaires hors-contexte (de type 2) 


Une grammaire est dite hors-contexte si toutes ses règles sont de la forme : 
À — @, avec À € Vy, O € V*. 
On appelle £-règle une règle de la forme À — e, et Z-règle une règle de la forme À — B avec B € Vy. 
Les grammaires hors-contexte sont souvent appelées formes de Bacckus. Elles sont équivalentes aux cartes syntaxiques 
couramment utilisées pour définir la syntaxe des langages de programmation. 


3.3.4 Grammaires linéaires à droite, grammaires linéaires à gauche (de type 3) 


Une grammaire est dite linéaire à droite si toutes ses règles sont de l’une des deux formes suivantes : 
— À — GB, avec A,B € Vy, © € Vr*x 

— À — O, avec À € Vy, ® € Vr*x 

Une grammaire est dite linéaire à gauche si toutes ses règles sont de l’une des deux formes suivantes : 
— À — Bo, avec A,B € Vy, © € Vr*x 

— À — O, avec À € Vy, O € Vrx 


3.3.5 Définitions et propriétés 


Toute grammaire linéaire à droite, ainsi que toute grammaire linéaire à gauche est une grammaire hors-contexte. 
Toute grammaire hors-contexte ne contenant pas d’e-règle est une grammaire sous-contexte. 

Un langage est dit linéaire à droite (hors-contexte, sous-contexte) s’il existe une grammaire linéaire à droite 
(hors-contexte, sous-contexte) qui l’engendre. 

Pour tout langage régulier (c’est-à-dire défini par une expression régulière - voir le paragraphe [-9.3du chapitre 
M. il existe une grammaire linéaire à droite et une grammaire linéaire à gauche qui l’engendrent. Les langages 
réguliers sont aussi définis les automates finis (voir le chapitre D). Tout langage régulier est hors-contexte 
(puisque toute grammaire linéaire à droite est hors-contexte) ; la réciproque est fausse : par exemple le langage 
{a"b" | n > 1} est hors-contexte mais n’est pas régulier. 

— Tout langage hors-contexte ne contenant pas la chaîne vide est sous-contexte (en effet, tout langage hors-contexte 
ne contenant pas € peut être engendré par une grammaire hors-contexte sans £-règle ; cette propriété est démon- 
trée au chapitre[VIN)}. La réciproque est fausse : par exemple le langage {a"b"c" | n > 1} est sous-contexte mais 
n’est pas hors-contexte (voir le chapitre [VI]. 


20 


— Les langages engendrés par les grammaires générales (c’est-à-dire sans restriction sur les règles) sont dits récur- 
sivement énumérables : à partir d’une grammaire, on peut construire un algorithme qui énumère toute les chaînes 
du langage engendré par la grammaire ; réciproquement, étant donné un algorithme énumérant les chaînes d’un 
langage, on peut construire une grammaire engendrant ce langage . 

— On appelle langage récursif tout langage pour lequel il existe un algorithme de reconnaissance (c’est-à-dire un 
algorithme qui, pour toute chaîne w sur le vocabulaire du langage, décide si w appartient au langage ou non). On 
peut montrer que tout langage récursif est récursivement énumérable, et que la réciproque est fausse. Il existe 
d’autre part des langages qui ne sont pas récursivement énumérables. Les langages sous-contexte (et a fortiori 
hors-contexte et réguliers) sont récursifs. 


Exercice 3.1 


1. Définir un algorithme qui étant donné une grammaire quelconque, énumére les chaînes du langage engendré 
par cette grammaire. 


2. Déduire de l’algorithme ci-dessus que pour tout langage récursivement énumérable L il existe un algorithme de 
reconnaissance partielle (c’est-à-dire un algorithme qui reconnait toute chaîne w de L, mais ne s'arrête pas si 
w n'appartient pas à L). 

3. Prouver que tout langage engendré par une grammaire dont les règles satisfont la contrainte « & — $ implique 
[a |<|B | » est récursif. 
On peut montrer que ces grammaires sont équivalentes aux grammaires sous-contexte. 


3.3.6 Problèmes décidables - problèmes indécidables 


Etant donné une grammaire G (linéaire à droite, hors-contexte, etc.), on s’intéressera par la suite à des problèmes 
du genre : 

— L(G) est-il vide ? (problème du langage vide) 

— L(G) est-il infini ? (problème du langage infini) 

SC) = 

— L(G) est-il un langage régulier ? , etc. 
On dit qu’un de ces problèmes est décidable pour les grammaires linéaires à droite (hors-contexte, etc.) s’il existe un 
algorithme qui pour toute grammaire linéaire à droite (hors-contexte, etc.) calcule la réponse (oui ou non) au problème 
posé ; il est dit indécidable dans le cas contraire. Par exemple tous les problèmes énoncés ci-dessus sont décidables 
pour les grammaires régulières (la réponse au quatrième problème est toujours oui) ; les problèmes du langage vide 
et du langage infini sont décidables pour les grammaires hors-contexte (voir les chapitres MX]et[VTTI}) ; les deux autres 
problèmes sont indécidables pour cette classe de grammaires. 
D’autres problèmes importants sont : 

— le problème du mot : étant donné une grammaire G et une chaîne terminale x, est-ce que x appartient à L(G) ? 

— le problème de l’équivalence : étant données deux grammaires G1 et G2, est-ce que L(G1) — L(G2) ? 
Le problème du mot est décidable pour les grammaires sous-contexte (voir l'exercice [B.1]ci-dessus), pour les gram- 
maires hors-contexte (voir le chapitre M} et donc pour les grammaires linéaires à droite qui sont des grammaires 
hors-contexte particulières ; il est indécidable pour les grammaires générales . Si le problème du mot est décidable 
pour une classe de grammaires, les langages engendrés par les grammaires de cette classe sont récursifs. Le problème 
de l’équivalence est indécidable pour les grammaires hors-contexte ; il est décidable pour les grammaires linéaires à 
droite (voir le chapitre[VI]}. 


3.3.7 Choix d’un formalisme (classe de définitions) pour définir un langage de programmation 


Les types de grammaires introduits au paragraphe3.3]|constituent différents formalismes que l’on peut utiliser pour 
définir la syntaxe d’un langage de programmation. Pour choisir parmi ces formalismes on est guidé par les critères 
suivants : 


1. Le formalisme doit être suffisamment puissant pour contenir une définition du langage. 


2. Le formalisme doit être suffisamment simple pour que chaque définition puisse être compilée en un algorithme 
efficace de reconnaissance des programmes du langage défini. 
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3. Le formalisme doit contenir une définition du langage concise et facile à comprendre. 


Le critère 1) conduit à exclure le formalisme des grammaires régulières, qui ne permet pas de décrire les paren- 
thésages à une profondeur arbitrairement grande que l’on rencontre dans les langages de programmation (expressions 
avec parenthèses, structure de bloc, etc.). Les grammaires régulières (ou des formalismes équivalents) sont par contre 
souvent utilisées pour définir la lexicographie des langages de programmation (c’est-à-dire les identificateurs et les 
constantes). 

Le critère 2) conduit à exclure les grammaires générales (qui peuvent engendrer des langages non récursifs) et les 
grammaires sous-contexte, auxquelles on ne peut pas associer des algorithmes de reconnaissance efficaces. 

C’est pourquoi la plupart des langages de programmation sont définis par des grammaires hors-contexte (ou des for- 
malismes équivalents comme celui des diagrammes syntaxiques). Le critère 1) est alors à peu près satisfait (mais 
pas complétement ; par exemple le traitement des déclarations dans un langage de programmation ne peut être décrit 
par une grammaire hors-contexte, comme on le verra au chapitre PM). Le critère 2) est lui aussi à peu près satisfait 
(on utilise souvent des grammaires hors-contexte particulières admettant des algorithmes de reconnaissance plus effi- 
caces, comme les grammaires LL(1) ou LR(1)). Enfin définir un langage avec une grammaire hors-contexte revient à 
en donner une définition par récurrence qui satisfait souvent le critère 3) (voir le chapitre EX): 


3.4 Exemples 


3.4.1 Définition des nombres réels sans signe d’un langage de programmation avec une grammaire hors- 
contexte 


— Vr = {0, 125493000046, 
Vv = {RD NF} 


— Axiome : À 
— Règles : 
R —  D|DFINF 
D — NN 
F —  ENJESN 
N — CINC 
S — +|- 
S — 0|1/2/3/4/5/617|8/9 


Exercice 3.2 
1. Montrer que R =* 2.3E —6 


2. Trouver une grammaire régulière équivalente à la grammaire donnée. 


3.4.2 Langage {a"b'n>1} 


Soit la grammaire hors-contexte G, =< {a,b},{S},S,£S — aSblab} >. 
Il est facile de montrer que L(G;) = {a"b'\n > 1}. 


3.4.3 Langage des parenthèses des expressions 


Soit la grammaire hors-contexte G2 =< {a,b},{S},S,{S — aSb|SS|e} >. Les symboles a et b représentant re- 
spectivement le début et la fin d’un bloc, le langage engendré par G2 décrit toutes les structures de blocs possibles. La 
grammaire G est équivalente à la grammaire G3 =< {a,b},{S},S,{S — SaSble} > 
et à la grammaire G4 —< {a,b},{S},S,{S — aSbS|e} >. 


3.4.4 Grammaire engendrant les expressions régulières sur {a, b} 


_ Vr — {a,b,0,+,.,x,(,)} 
un Vy = LES LE X} 
Axiome : E 
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— Règles : 


E — E+TIT 
T — TF|F 
F —  X*X 
X — Ojalb|(E) 


3.4.5 Langage {a"b'c"\n > 1} 


Soit la grammaire Gs —< {a,b,c},{S,B,C},S,R >, où l’ensemble des règles R est : 


S — aSBC|aBC 
CB — BC 

aB — ab 

bB — bb 

bC  — bc 

cC — cc 


L'ensemble R satisfait la contrainte suivante : pour tout & — B appartenant à R, 0 < || < [f|. On peut montrer que les 
grammaires satisfaisant cette contrainte sont équivalentes aux grammaires sous-contexte définies au paragraphe [3.3.2] 
(Exercice F3). La grammaire G; engendre le langage {a"b"c"|n > 1}. On montrera au chapitre [VIT] que ce langage 
n’est pas hors-contexte. 


3.5 Exercices 


Exercice 3.3 Construire des grammaires hors-contexte pour les langages suivants 
1. {ww lwe {a,b}*} 
2. {aïbili£ jeti,j >0} 


Exercice 3.4 


1. On définit l’ensemble des formules de la logique propositionnelle comme l’ensemble des expressions construites 
avec l’opérateur — (non), les opérateurs binaires V (ou), A (et), — (implique), et des opérandes qui sont des 
symboles de propositions atomiques. On utilise l’ensemble des suites de lettres sur l’alphabet {A,B,...,Z} pour 
noter les propositions atomiques. 

Exemples : -AVB,A—(B— A), AAABV-—AAAC, (ABA — BB) A(ABA — -C), … sont des formules de la 
logique propositionnelle. 
Donner une grammaire hors-contexte engendrant l’ensemble des formules de la logique propositionnelle. 


2. Soit F = {a,b,f,g,h}, où a et b sont deux symboles de constantes, f et g deux symboles de fonctions unaires, 
h un symbole de fonction binaire. L'ensemble des termes sur F est l’ensemble des expressions que l’on peut 
construire avec les éléments de F. 


Exemple : h(a,b), f(f(b)),h(f(a),h(b,b)),... sont des termes. 


Donner une grammaire hors-contexte engendrant l’ensemble des termes sur F. 


3. Soit G= {=,<}, où = et < sont deux symboles de prédicats binaires. L'ensemble des propositions atomiques 
sur FÜUG est l’ensemble des expressions de la forme ti = t2 ou ti <f2, où f1 et t sont des termes sur F. 


Donner une grammaire hors-contexte engendrant l’ensemble des propositions atomiques sur FÜUG.. 


4. Soit X un ensemble infini de symboles de variables. On pose par exemple X = {x,y,7}*. 

L'ensemble des termes sur FU X, avec F défini en 2, est alors l’ensemble des expressions construites avec des 
opérandes pris dans {a,b} UX, et des opérateurs pris dans {f,g,h}. 

L'ensemble des formules atomiques sur FU GUX est l’ensemble des expressions de la forme t1 = t2 ou t1 < #2, 
où t1 et t2 sont des termes sur F UX. 

L'ensemble des formules de la logique des prédicats sur FÜUGUX est l’ensemble des expressions construites 
avec les formules atomiques sur FU GUX, les opérateurs de la logique propositionnelle —,V,A\,— et les 
quantificateurs V et 2. 
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Exemples : (Vxf(x) = fQ)), Gif) = 80) — (Pxf) = 80), (Vif) = FO), FO) < 86) V (f(x) < 
FQ)), (VavyVzx < y A y < 7 — x <z), ..…. sont des formules de la logique des prédicats. 
Donner une grammaire hors-contexte engendrant l’ensemble des formules de la logique des prédicats. 
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Exercice 3.5 
Soit G—< Vr,Vy,S,R > la grammaire définie par : 
Vr = {a,b,c}, Vn = {S,A,B}, R est l’ensemble de règles 


S$S  —  aSA|bSBlc 
CA — ca 
cB — cb 
aÂ — Aa 
aB — Ba 
bA — Ab 
bB — Bb 


1. Quel est le type de cette grammaire ? 

2. Donner une dérivation de la chaîne abcab. 

3. Prouver que L(G) = {wcw |w € {a,b}*}. 
Exercice 3.6 Décrire les langages engendrés par les grammaires suivantes, où S est l’axiome et les non-terminaux 
sont les lettres majuscules apparaissant dans les règles : 


1. Grammaire hors-contexte : 


S — bSS|a 
2. Grammaire sous-contexte : 
S — Hat 
#a —  #B 
Ba —  aaB 
B# — aa 


Exercice 3.7 Soit G—<Vr,Vy,S,R > une grammaire. Montrer qu'il existe une grammaire équivalente G'=<Vr,VY,S',R'> 
dont toutes les règles à — $ sont telles que à € A 


Exercice 3.8 Montrer qu'un langage est sous-contexte si et seulement si il est engendré par une grammaire dont 
toutes les règles à — $ sont telles que 0 < |a] < [B|. 


Exercice 3.9 Montrer qu'un langage ne contenant pas la chaîne vide est engendré par une grammaire linéaire à droite 
si et seulement si il est engendré par une grammaire dont toutes les règles sont de l’une des deux formes suivantes : 
— À — aB, avec A, BE Vy, a € Vr 
— A—a,avec AEVN, a€ Vr 


Exercice 3.10 Montrer qu'il n'existe pas de grammaire linéaire à droite engendrant le langage {a"b"\n > 1}. 
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Chapitre III 


Grammaires hors-contexte 


1 Propriété fondamentale (décomposition des dérivations hors-contexte) 


La propriété E-4 du chapitre m signifie que l’on peut composer des dérivations d’un système de réécriture ; la 
réciproque de cette propriété, qui est fausse pour les systèmes de réécriture généraux, est vraie pour les grammaires 
hors-contexte : on peut décomposer une dérivation hors-contexte en sous-dérivations indépendantes. Cette propriété 
fondamentale des dérivations hors-contexte est très souvent utilisée dans les démonstrations. 


Théorème 1.1 Soit G—< Vr,Vn,S,R > une grammaire hors-contexte. On pose V = VrÜVx. 
Soit une dérivation u1 ...un =? w, avec u;j € V* pouri=1,...,netw € V*. 
Alors pour i = 1,...,n, il existe v; E V* et qi EN tels que : 


= W—V],...,Vn 

— pouri=1],...,n,u; di v; 
_ va . 

= p= rit 


Preuve : On procède par récurrence sur p. 

— Si p = 0, le théorème est vrai. 

— Supposons que le théorème soit vrai pour toute dérivation de longueur p. 
Considérons une dérivation w1...uy —?*! w. Puisque les parties gauches des règles d’une grammaire hors- 
contexte sont de longueur 1, la première règle de la dérivation considérée est appliquée à un u;. Il existe donc u; 
ett; € V* tels que : 
UUi UE] Un > U1...Ui Ut Un p W. 
On applique l’hypothèse de récurrence à la sous-dérivation de longueur p : il existe v1,...,Vh,q1,...,Qn tels 
que : 
. W=VI...Vn 
. pour kde 1ài—-letdei+1àn,ug =%X vx 
. GS y; 
- P— Lit dj 
Puisque u; dit y;, le théorême est vérifié pour la dérivation w1...u, = P+L 


La propriété fondamentale a été énoncée pour la relation de dérivation A2 (c’est-à-dire la relation =?). Nous 
énonçons ci-dessous comme corollaire la propriété fondamentale pour la relation —* (relation de dérivation A:). 


Corollaire 1.1 Siu;...u, —* w dans une grammaire hors-contexte, alors il existe v1,...,vA tels que w = vi...v, et 
U =" Vi... Un > Ve 


Nous étudierons au paragraphe Ela propriété fondamentale pour les relations de dérivation A3 et A4. 
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Remarque 1.1 Dans la suite de ce chapitre, sauf exceptions signalées, nous ne parlerons que des grammaires hors- 
contextes en utilisant implicitement les notations du théorème ci-dessus. 


Exercice 1.1 


1. Donner un contre-exemple montrant que la propriété fondamentale est fausse pour une grammaire qui n’est pas 
hors-contexte. 


2. Soit <V,R > un système de réécriture tel que toutes ses dérivations satisfont la propriété fondamentale. Prouver 
que toutes ses règles sont de la forme a — @, avec a appartenant à V et © appartenant à V*. Ainsi la propriété 
fondamentale caractérise les systèmes de réécriture dont toutes les règles ont une partie gauche de longueur 1. 


2 Dérivations indicées dans une grammaire hors-contexte 


La notion de dérivation indicée a été définie au chapitre m paragraphe [2.7] Rappelons que si x 8 y dans un 
système de réécriture À, il est possible que 


1. plusieurs règles de R permettent de réécrire x en y 
2. une même règle de R puisse s’appliquer à différentes sous-chaînes de x pour donner y. 


On a levé ces ambiguïtés en utilisant une relation =:;,; où i est le rang du premier caractère de la sous-chaîne de x qui 
est réécrite, et r est la règle utilisée. 

Quand R est un ensemble de règles hors-contexte il suffit d'indiquer le rang du caractère de x qui est dérivé : la donnée 
de la chaîne de départ x, de la chaîne obtenue y et de l’indice à du caractère réécrit permet de retrouver la règle r 
appliquée. 

Aussi nous simplifions les notations introduites au paragraphe D] en ne précisant dans les dérivations indicées, que 
la position du symbole dérivé. 


2.1 Dérivations indicées gauches 


Définition 2.1 (Dérivation indicée gauche) Soit x1,...x € V*eti,...iyg 1 EN. 
Une dérivation indicée dans une grammaire hors-contexte x1,i1,...,xx_1,ix_1,x4, est dite dérivation indicée gauche si 
les positions des symboles dérivés sont croissantes, c'est-à-dire sii; <i;,1 pour j de 1 àk—7. 


Théorème 2.1 Pour toute dérivation indicée, il y a une dérivation indicée gauche de même longueur, origine et ex- 
trémité 


Preuve : 
Soit D = x1,i1,...,ig_1,x4 une dérivation indicée où x1,x2...,xt € V*eti,...i_1 EN. 
Soit P(n) la propriété suivante : 

— nest le nombre d’inversions de la suite des indices 

— il y a une dérivation indicée gauche de même longueur, origine et extrémité que la dérivation ci-dessus. 
P(0) est trivialement vraie. 
Soit n > 0. Supposons P(j) vraie pour tout j < n et prouvons P(n). Puisque n > O, il existe p tel que p < k—2 et 
ip > ip+1. Par suite 

— x) = uAvBw où u,v,w € V*,A,B € Vyeti, = [uAvB|,i,}1 = |uA| 

— Xp+1 = 4Avfw où B — $ 

— Xp+2 = uOvBw où À — à 
Dans la dérivation D, on remplace x,,,i,,Xp+1,ip+1,Xp+2 PAT Xp, ip+1,Y; J,Xp+2 OÙ 
y = uovBw et j = [uovB| = juAvB| + |] — 1 = i, +]o| — 1. 
Puisque i}1 < ip, On a ip41 < j. 
Soit D’ la nouvelle dérivation ainsi construite (par permutation des applications de deux règles). Cette dérivation 
comporte moins de #7 inversions, donc par hypothèse de récurrence, il existe dérivation indicée gauche de même 
longueur, origine et extrémité que la dérivation D’ donc de D. 
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Remarque 2.1 En analysant la preuve ci-dessus, on constate que la nouvelle dérivation ne fait que permuter l’ordre 
d'application des règles. 


Exemple 2.1 Soit A — AA|a une grammaire hors-contexte et la dérivation indicée : 

AA =) AAA =; AAAA. 

En permutant l’ordre d'application de la règle À — AA, on obtient la dérivation indicée gauche : 
AA =; AAA =3 AAAA. 


2.2 Dérivations gauches 


Définition 2.2 Soit x1...xx une dérivation (définition A3 - cf le paragraphe E.Adu chapitre [I) dans une grammaire 
hors-contexte. On dit que cette dérivation est une dérivation gauche si pour chaque élément x; de la dérivation le 
non-terminal réécrit est le non-terminal le plus à gauche de xi. 

Pour une grammaire hors-contexte donnée, on définit la relation —, par : 

x >, y si et seulement si il existe une chaîne terminale u, un non-terminal À, une chaîne v et une règle À — à tels que 
x = uAv et ÿ = uw. 

Une dérivation x1,...xy est une dérivation gauche si et seulement si x; = xi,1 pour i= 1...k—1. 


Exemple 2.2 Soit la grammaire suivante avec Vr = {a,+,*,(,)},Vn = {E,T,F} et les règles : 
E — E+TIT 
T — Tx+F}F 
F —  (E)la 

Ona'ER E+T=ST+T=,F+T=Sa+T=ça+rF=,a+a. 


En fait une dérivation gauche est un cas particulier d’une dérivation indicée gauche, comme le montre la preuve du 
théorème suivant. 


Théorème 2.2 Soit À un non-terminal et x une chaîne terminale. Si A =? x, alors À S. X. 


Preuve : Si À =? x, il existe, d’après le théorème [2.1] une dérivation indicée gauche 
X1,01,...Xk 1,1, ,Xg AVEC X1 = À et xx = x. 

La dérivation D = x1,x2,...xx est alors une dérivation gauche d’origine À et d’extrémité x. En effet, soit x; £ x un 
élément de cette dérivation. Aucune lettre de x; d’indice strictement inférieur à i; (c’est-à-dire à gauche du symbole 
réécrit de x;) n’est réécrite dans la dérivation D. Toutes ces lettres sont donc des lettres de x, et la chaîne x étant 
terminale, sont donc des lettres terminales. Il s’ensuit que D est une dérivation gauche. 


Remarque 2.2 On peut définir de façon analogue des dérivations indicées droites et des dérivations droites, et dé- 
montrer les équivalents pour ces dérivations des théorèmes[.T|er[.7] 


3 Décomposition des dérivations indicées gauches 


Définition 3.1 (Somme de deux dérivations indicées gauches) Soit D\ la dérivation indicée gauche 
X1,41,...,Xg 1,1, Xx OÙ x, Xp € V*,ü,... 1 EN. 

Soit D) la dérivation indicée gauche 

Vis es O Ml ME Nan 1 EN 

Di + D, est la dérivation indicée d’origine x1y1 obtenue en effectuant D; puis D», c’est-à-dire la dérivation : 
21)1:41,-..26 1918124) 1] + 1,231, [Xe + 1 xd 

Il est clair que, puisque D et D2 sont des dérivations indicées gauches, il en est de même de Di + D> 


Remarque 3.1 1! est facile de voir que cette somme est associative, ce qui rend sans amiguïté la somme de n dériva- 
tions Di + Do +...+D,. 
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Exemple 3.1 Soit la grammaire $ — £|aSbS|bSas. 

Soit D la dérivation indicée S,1,e. 

Notons que a (respectivement b) sont des dérivations indicées gauches de longueur 0. 
b+D=EBS,2,b 

a+ D +b = bSa,2,ba 

a+D+b+D = bSas,2,basS,3,ba 


Propriété 3.1 (Décomposition des dérivations indicées gauches) Soit x — uju2 où u1,u2 € V* et D une dérivation 
indicée gauche d’origine x. Il existe une et une seule décomposition de D en deux dérivations gauches D; d’origine u; 
et D; d’origine u telles que D = D; + D:. 


Preuve : Soit D = wi,i1,...wg_1,ix_1,wx une dérivation indicée gauche où x = wi, w1,...,wy € V*, i,...i 1 EN. 
Si k — 0 alors Di = ui et Di = w. 

Supposons & > 0 et la propriété vraie pour toute dérivation indicée gauche de longueur inférieure à k. 

Montrons que la propriété est aussi vérifiée par D. 

Considérons les deux cas suivants : 


Lu > lui]. 
Dans ce cas Dj = ui. 
Pour n de 1 à k, soit v, tel que w, = u1vA (v, est le suffixe de 1 dans w,). 
Pour n de 1 à k, soit jy = in — |u1|. 
On a D; — Visio. Jk—1 VE 


2: il < lui |. 
Donc il y a des chaines s,f,0t et un non terminal À tels que w1 = sAfvi, À — ©, w2 = so vi] . 
Soit D’ la partie de la dérivation D commençant en w2. Vu l’hypothèse de récurrence, il y une décomposition 
unique de D’ en D d’origine so et D d’origine vi. 
Soit Di — soi, D! (ce qui assure l’unicité de D;). On a : D = D; +D:. 


Propriété 3.2 (Décomposition des dérivations indicées gauches) Soit x — uju2,...,u, où u1,u2,...,un € V* et D 
une dérivation indicée gauche d’origine x. Il existe une et une seule décomposition de D en n dérivations indicées 
gauches D; d’origine ui et D: d’origine ur, ... D, d’origine u, telles que D = Di +D2+...+Dy. 


Preuve : La preuve est une généralisation par récurrence sur n de la propriété. 1]ci-dessus. 


4 Arbre de dérivation 


Les arbres de dérivation sont une autre représentation plus visuelle du processus de dérivation. Nous verrons qu’il y 
a une bijection entre les arbres de dérivations et les dérivations indicées gauche ayant comme origine un symbole. Nous 
donnerons deux définitions des arbres de dérivation, la première définit un arbre comme une expression et la deuxième 
est plus proche des arbres utilisés en informatique. Pour démontrer l’existence de la bijection, nous utiliserons la 
représentation des arbres dérivation par des expressions, mais en pratique, on préfère la deuxième représentation. 
Dans ce paragraphe, on note les grammaires comme précédemment par G=< Vr,Vy,S,R > et on pose V = Vr UVx. 


Exemple 4.1 Soit la grammaire S — aSbS|bSaS|e et la dérivation indicée gauche : 

S =; aSbS = abS —;3 abaSbS —4 ababS —5s abab. 

Les indices sont inutiles car cette dérivation est une dérivation gauche où le non-terminal le plus à gauche est dérivé 
à chaque pas de la dérivation. 

L'arbre de dérivation est représenté, 


— soit par l'expression S(a,S(b,S(),a,S()),b,S()) 
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— soit par l’arbre S 


PÉLRT 
| | 


Définition 4.1 (Arbre = Expression) Un arbre de dérivation d'origine a où a € V pour la grammaire G est 
— soit a 
— soit a(ei,...,en)où:n>0 
Pour i de 1 à n, e; est un arbre de dérivation d’origine b; 
a — b1...b, est une règle de la grammaire G 


Exemple 4.2 Pour la grammaire S — aSbS|bSaS|e de l'exemple précédent, les expressions 
a,b,S(),S(b,S(),a,S()),S(a, S(b,S(),a,S()),b,S()) sont des arbres de dérivation. 


Définition 4.2 (Arbre = Domaine d’arbre et étiquettes) 


1. Domaine d'arbre : un domaine d’arbre est un ensemble de suites finies d’entiers naturels 
— qui est fermé par préfixe : si u.v € D alorsu € D 
— qui vérifie : siieNetu.(i+1) € D alors u.ie D 
On reconnaîtra dans un domaine d’arbre la numérotation usuelle des livres (dont cet ouvrage) : si le paragraphe 
2.3.2 existe, alors existent notamment les paragraphes 2 et 2.3.1. 


2. Arbre : soit D un domaine d'arbre fini, un arbre de dérivation pour la grammaire G est une application a de D 
dans V U {£} telle que : 
sinEN,u€eD,uneDetu.(n+1)6€D alors 
a(u) — a(ul)...a(un) est une règle de G 


Soit a : D+- V un arbre de dérivation : 
— u € D est un sommet de l’arbre. 
— € (la suite vide d’entiers) est la racine de l’arbre. 
— a(u) est l'étiquette du sommet u. 
- SiuED,ieNetuiEe D alors le sommet ui est un successeur du sommet u. item Si u € D et u n’a pas de 
successeur, alors u est une feuille de l'arbre. 
— Siu € Det uv € D, alors uv est un descendant du sommet u. 


Les arbres de dérivation ainsi définis, sont dessinés comme dans l'exemple F.1] Les suites d’entiers sont omises et 
remplacées par des flêches vers le bas allant d’un sommet vers chacun de ses successeurs. Le successeur u.(i+ 1) est 
placé à droite du sommet u.i. 


Théorème 4.1 Soit G une grammaire. Il y a une bijection entre les arbres de dérivation de G et les dérivations indicées 
gauches ayant pour origine un symbole de G. 


Preuve : Soit V le vocabulaire de G. On définit une application a2d entre les arbres de dérivation de G (suivant la 
définitionff.1} et les dérivations indicées gauches ayant pour origine un symbole de G par : 

- a2d(a)=aoùaevV 

— a2d(a(ei,...en)) = a,l1,a2d(e;)+...+a2d(e;) 
Nous prouvons que a2d est une bijection. 
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1. a2d est injective. 
Soient deux arbres T et U tels que a2d(T) = a2d{(U). Par récurrence sur les sous-arbres de T, on montre que 
T =U. 
Admettons que la propriété ci-dessus soit vérifiée pour tout sous-arbre strict de T.. 
(a) TE V. 
Par définition de a2d, a2d(T) = T. Puisque a2d{U) € V, seul le premier cas de la définition de a2d 
s’applique, donc a2d{(U) =U =T. 
(b) T=ale],...,eh). 
a2d(T) = a,l,a2d(e;)+...+a2d(eh). 
Soit D la dérivation indicée gauche a2d(e1)+...+a2d(e,). 
Pour i de 1 à n, soit b; l’origine de l’arbre e;. 


i. Puisque a2d(T) = a2d{(U) alors U et T ont même origine, donc U = a(fi,..., f,). 
Pour i de 1 à p, soit c; la racine de fi. 
ii. Puisque a2d(T) = a2d{U) et que donc b1...b, et c1...c, sont l’origine de la dérivation D, il en 
résulte que n = pet pouride làn,b;=c;et U —=a(f;,..., fn). 
iii. Par définition de a2d, a2d(U) = a,1,a2d(fi)+...+a2d(f;) où D = a2d(f1)+...+a2d(f;). 
En résumé D = a2d(e;)+...+a2d(es) = a2d(fi)+...+ a2d{(fn), D a comme origine b1...b, et 
pour i de 1 à n, b; est la racine commune à a2d/(e;) et a2d{ f;). 
D’après la propriété[5.2]il en résulte que pour i de 1 à n, a2d(e;) = a2d( f;). 
Par hypothèse de récurrence pour i de 1 à n, e; = fi, donc T = U. 
2. a2d est surjective. 
On le prouve par récurrence sur la longueur des dérivations. 
Soit D une dérivation indicée gauche ayant comme origine le symbole a € V. 
Si D est de longueur O, alors D = a et a2d(D) = D. 
Supposons que D soit de longueur non nulle donc de la forme D = a,1,D". 
Soit b1...b, l’origine de D’ où pour i de 1 à n, b; est un symbole. 
Puique D est une dérivation, a — b;...b, est une règle de la grammaire. 
D’après la propriété [5.2] D'=D;i+...+D, où 
pour i de 1 à n, D; est une dérivation indicée gauche d’origine b;. 
Par hypothèse de récurrence,pour i de 1 à n, il existe un arbre de dérivation e; d’origine b; tel que a2d(e;) = D;. 
Par la définition [4.1]des arbres, a(e1,...,e,) est un arbre de dérivation de la grammaire G. 
Par définition de a2d, a2d{a(e;,...,e,)) = D. Donc a2d est surjective. 


5 Ambiguïté 


Définition 5.1 Soit G = Vr,Vy,S,R > une grammaire hors contexte. 

La grammaire G est ambigüe s’il existe une chaîne terminale admettant au moins deux arbres de dérivation de racine 
S, soit encore de façon équivalente, d’après le théorème [4.1] deux dérivations gauches d’origine S. 

Une chaîne terminale qui est l'extrémité d’au moins deux dérivations gauches d’origine S est une chaîne ambigiüie de 
la grammaire G. 

Un langage hors-contexte est ambigu si toutes les grammaires hors-contextes qui l’engendrent sont ambigües. 


Exercice 5.1 Soit la grammaire suivante, ayant pour vocabulaire terminal l'unique symbole a, et comme règles : 
S — A|B,A — a,B—a 


1. Montrez qu'elle est ambigiüe. 


2. Le langage engendré par cette grammaire n’est pas ambigu. Donnez une grammaire non ambigüe équivalente. 


Exercice 5.2 Soit la grammaire G suivante, de vocabulaire terminal 0, 1, et de règles S — OS1|0S11|e 
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1. Montrez qu'elle est ambigiie. 
2. Prouvez que L(G) = {O"1" |n < m <2n}. 
3. Montrez que le nombre de dérivations gauches dans la grammaire G de la chaîne O"1" est (n,_,). 


Indication : la longueur de la dérivation de cette chaine est n + 1. Une dérivation particulière est caractérisée 
par le choix des m — n emplacements de l’usage de la règle S — OS11. 


4. Donnez une grammaire non ambigüe équivalente. 


Exercice 5.3 La grammaire suivante, de vocabulaire terminal a,b, et de règles S — aSb|SS|e peut être vue comme 
décrivant la structure des parenthèses d’une expression bien parenthésée, a jouant le rôle de la parenthèse ouvrante 
et b celui de la parenthèse fermante. 

1. Montrez que cette grammaire est ambigiüe. 

2. Montrez qu'elle est équivalente à la grammaire S — aSbS|e 


3. Montrez que la grammaire ci-dessus n’est pas ambigiüe 


Exemple 5.1 Le langage {a'bic* | i = j ou j = k} est un langage hors-contexte ambigu. Il est facile de donner une 
grammaire hors-contexte qui l’engendre. Il est intuitif mais difficile de prouver que ce langage est ambigu, c’est 
pourquoi nous le proposons pas en exercice. 


Remarque 5.1 1! n°y a pas d’algorithme permettant de répondre à la question "la grammaire G est-elle ambigüe ?": 
le problème de l’ambigüité d’une grammaire est indécidable. 


Exercice 5.4 Soit la grammaire suivante, de vocabulaire terminal si,alors,sinon,e,a, et de règles 
1— siealorsi| siealorsI sinonl|a. 
1. Montrez que cette grammaire est ambigiüe. 


2. Trouvez une grammaire équivalente non ambigüe. 


Exercice 5.5 Soit la grammaire G suivante, de vocabulaire terminal a,b, c et de règles 
S — aSclaS|T 
T — bTclbT | 

1. Montrez que cette grammaire est ambigüe. 

2. Montrez que L(G) = {abc | p+q>r>0} 


3. Trouvez une grammaire équivalente non ambigüe. 


Exercice 5.6 Soit L = {w € {a,b}* | w contient autant de a que de b}. Soient les trois grammaires G1,G2,G3 ayant 
pour règles 
— Gi:$—EelaSb|bSa|SS 
— G2:$5— aSbS\bSas|e 
— G3:$— aB|bA|E 
A — aS|bAA 
B — bS|aBB 


1. Montrez que ces trois grammaires engendrent le langage L. 
2. Montrez qu'elles sont toutes ambigües 


3. Donnez une grammaire non ambigüe engendrant L 


Exercice 5.7 Soit Vr = {0,1} un vocabulaire terminal et L = VS — {ww | w € Vf}. Montrez que L est un langage 
hors-contexte. Le problème n’est pas facile et nous le décomposons en questions intermédiaires. Il est clair que les 
chaînes de longueur impaire (sur le vocabulaire terminal {0,1}) sont éléments de L. 


1. Soit Y l’ensemble des chaînes de longeur impaire dont le milieu est 1. 
Trouvez une grammaire engendrant Y. 
Soit Z l’ensemble des chaînes de longeur impaire dont le milieu est 0. 
Trouvez une grammaire engendrant Z. 
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2. Montrez que toute chaîne de YZUZY n'est pas de la forme ww 
3. Montrez que toute chaîne de longueur paire, qui n’est pas de la forme ww, est élément de YZ UZY. 
4. En déduire une grammaire engendrant L 


On trouvera un excellent corrigé de cet exercice dans le cours du Professeur Nievergelt : 


Exercice 5.8 Soit la grammaire S — SS|a. 


1. Montrez qu'elle engendre a* l’ensemble des suites non vides de a. 
2. Montrez que cette grammaire est ambigüe 


3. Soit X, le nombre de dérivations gauches de a”. Prouvez que Xn+1 = (1/(n+1))(2") 
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Chapitre IV 


Automates finis 


1 Introduction 


Un automate fini est une machine abstraite qui effectue des calculs en utilisant une mémoire de taille bornée. Il 
n’est pas possible d'augmenter la taille de la mémoire au delà de cette borne. Les tailles des données et des résultats 
peuvent être supérieurs à cette borne puisque les données sont lues, les résultats produits progressivement au cours du 
calcul. La longueur d’un calcul peut aussi être supérieure à la taille de la mémoire de l’automate ; celui-ci passe alors 
nécessairement plusieurs fois par un même état de sa mémoire. Les automates finis ont des applications importantes : 
définition de certains aspects des langages naturels ou artificiels (en particulier de la lexicographie), description de 
machines physiques (circuits électroniques, machines à calculer, distributeur d’objets, etc.), définition de protocoles 
de communication dans des réseaux, description de systèmes de commandes (comme le système de commandes d’un 
ascenseur), etc. Les automates finis peuvent être utilisés pour calculer des fonctions, ou pour reconnaître des langages. 
On montre que les langages reconnus par les automates finis coïncident avec les langages réguliers, c’est-à-dire les 
langages qui sont les valeurs des expressions régulières. Les langages réguliers comprennent, outre les langages finis, 
les langages infinis que l’on peut définir en utilisant l’opération de concaténation itérée (l’étoile). Un ordinateur - en 
faisant abstraction des mémoires périphériques - peut être décrit par un automate fini, puisque sa mémoire centrale est 
de taille bornée. Mais ce type de descriptions n’a que peu d’intérêt, au vu de la taille très grande des mémoires des 
ordinateurs. Un meilleur modèle est fourni par les machines de Turing, qui utilisent une mémoire finie non bornée. 


Exemple 1.1 (Automate fini reconnaissant les chaînes de caractères d’un langage de programmation) Cet ensem- 
ble est défini informellement par : 
toute chaîne commence et se termine par le caractère " (guillemets) ; toute occurrence du caractère ” (guillemets) à 
l’intérieur d’une chaîne doit être doublée. Par exemple, la chaine de caractères je dis “oui” s’écrit : "je dis ""oui"""; 
la chaîne de caractères de longueur 1 se composant d’un seul guillemet s'écrit : """". 
L'ensemble peut être défini formellement par l'expression régulière : "(c* + "")*" 
où les opérateurs des expressions régulières sont notés en gras, et c désigne un caractère quelconque différent de ". 
Le dessin ci-dessous représente un automate fini reconnaissant l’ensemble des chaînes de caractères : les chaînes 
de caractères sont les chemins reliant le sommet le plus à gauche (l’état initial de l’automate) au sommet le plus à 
droite (l’état final de l’automate). Comme précédemment, le symbole c désigne un caractère quelconque différent du 


caractère ”, L’automate a trois états : 
€ 


(0) (XT TO 
Exemple 1.2 (Automate fini décrivant les déclarations de procédure d’un langage de programmation.) /nformel- 
lement , une déclaration de procédure commence par le mot clé procédure, suivi d’un identificateur qui est le nom de 


la procédure. On a ensuite la déclaration de la liste des paramètres (cette partie peut être vide), puis, après un “ ;”, le 
corps de la procédure. Chaque paramètre est un identificateur, auquel est associé un type. On sépare un paramètre de 
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€ 


son type par le caractère “ :”. On peut mettre en facteur des paramètres ayant la même type. Le corps de la procédure 
commence par le mot clé début, suivi d’une liste non vide d’instructions, et se termine par le mot clé fin. Les instruc- 
tions sont séparées par le caractère “ ;”. 

Dans l’automate ci-dessous, qui contient 12 états, les déclarations de procédures sont définies par l’ensemble des 
chemins de l’état initial (en haut à gauche) à l’état final (en haut à droite). On n’a pas défini les identificateurs, les 
types et les instructions. Il n’y a pas de difficulté à définir les identificateurs avec un automate fini. Par contre, si les 
instructions peuvent contenir des déclarations de procédures, on ne peut pas décrire les déclarations de procédure par 
un automate fini : un formalisme équivalent aux grammaires hors-contexte est alors nécessaire. 


» 


Ou (D idf © : (3) debut (éme) Jin 


Nous verrons au paragraphe [7 de ce chapitre que les fonctionnalités d’un automate fini peuvent être étendues en 
lui ajoutant une fonction de sortie. L’exemple ci-dessous montre comment se servir d’un tel automate pour calculer la 
somme de deux entiers binaires. 


Exemple 1.3 (Automate fini calculant la somme de deux entiers notés en binaire) Les deux entiers à additionner 
sont écrits sur le même nombre de chiffres binaires. L'automate lit simultanément les deux opérandes, en commençant 
pas les chiffres des unités, et produit le résultat chiffre par chiffre en commençant par le chiffre des unités. Ses entrées 
sont donc les couples de chiffres binaires. Pour chaque entrée, l’automate produit un résultat qui est un chiffre binaire. 
La notation 00 / I signifie : pour l'entrée 00, on produit 1. L’automate a deux états : l’état s correspond à l'absence 
de retenue, l’état r à la présence d’une retenue. Deux entiers à additionner définissent un chemin de l’automate, 
commençant par l’état sans retenue s. Si ce chemin se termine en 5, il définit aussi le résultat de l’addition ; s’il se 
termine en r, il faut encore écrire un 1 pour la retenue. 


11/0 

00/0 01/0 

O1/1 0) 10/0 

10/1 L/1 
00/1 


La suite de ce chapitre comprend : 

— La définition des automates finis reconnaissant des langages, comme ceux des exemples[T.T]et[T.2] On consultera 
le paragrapheP] 

— Les preuves de l’équivalence des automates finis avec des automates finis particuliers : automates sans € transi- 
tions (paragraphe EF). automates déterministes (paragraphe). 

— La preuve de l’équivalence des automates finis et des expressions régulières fait l’objet du chapitre[V] 

— Le problème de la minimisation des automates finis est traité au chapitre[VI] 
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— Les automates définissant des fonctions, comme celui de l’exemple[T.3] - encore appelés machines finies - sont 
étudiés brièvement au paragraphe Pau présent chapitre. 


2 Automates finis et langages 


Définition 2.1 (automate fini) Un automate fini est un quintuplet < Q,V,6,1,F > où : 
— Q est un ensemble fini d'états 
— V est un ensemble fini de symboles (le vocabulaire de l’automate) 
— Ôest un sous-ensemble de Q XV U{E} x Q appelé l’ensemble des transitions 
— l'est un sous-ensemble de Q, l’ensemble des états initiaux 
— Fest un sous-ensemble de Q, l’ensemble des états finals 
Une transition de à telle que (p,a,q) est appelée une a-transition. L'état p est l’origine et l’état q est l'extrémité de 
cette transition. 
On peut aussi voir à comme une application de Q x V Ü{e} dans P(Q) en posant pour p € Q, a E VU{E} : 


Ô(p,a) — {q|(p,a,q) € 8} 


Un automate ayant Ô comme ensemble de transitions est dessiné avec les conventions suivantes : 


00 signifie que (p,a,q) € 
2 ét 
00 signifie que (p,a,q) € à et (p,b,q) € 


——?) indique que p est un état initial 


indique que p est un état final 


Exemple 2.1 D'après ces conventions, l’automate ci-dessous : 
0,1 0,1 


OO) 


a comme état initial p, comme état final r et comme ensemble de transitions {(p,0,p),(p,1,p),(p,0,g),(q,1r),(r,0;r),(r,1;r)}. 


Définition 2.2 (chemins et traces) Soit À —< Q,V,6,1,F > un automate fini. 

Un chemin de À de longueur n est une suite de transitions (r;,ai:1,r;x1) où 0 < i < n. Ce chemin mène de l’état ro à 
l’état r, avec la trace ai ...a,. Par convention, la suite vide est un chemin de longueur 0 et de trace £ conduisant d’un 
état à lui-même. 


Dans l’exemple ci-dessus, (p,1,p)(p,0,g)(g,1,r)(r,1,r) est un chemin de p à r dont la trace est 1011. 


Définition 2.3 (mots et langage reconnu par un automate) Le mot x est reconnu (ou accepté) par un automate s’il 
y a un chemin de cet automate de trace x menant d’un état initial à un état final. 

On note L(A) l’ensemble des mots reconnus par l’automate A. L(A) est le langage reconnu par l’automate A. 

Un langage reconnu par un automate fini est appelé langage d’états finis. 

Deux automates sont équivalents s'ils reconnaissent le même langage. 


Dans l’exemple ci-dessus, le mot O1 est reconnu et le langage reconnu par l’automate est défini par l’expression 
régulière (0 + 1)*01(0+ 1)*, qui caractérise l’ensemble de mots sur {0,1} comportant le sous-mot 01. 
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Exemple 2.2 Considérons l’automate suivant sur le vocabulaire {0,1} : 
0,1 


à 1 0 1 

(p) (4) (r) 
(p,0,p)(p,1,q)(q,0,r)(r,1,s) est un chemin menant de p à s avec la trace O101. Ce mot est reconnu par l’automate 
car p est un état initial et s est un état final. 


Le langage reconnu par l’automate est défini par l'expression régulière (0 + 1)* 101, qui caractérise l’ensemble de 
mots sur {0,1} terminés par 101. 


Exercice 2.1 Définir un algorithme, qui, étant donné un automate fini À et une chaîne x sur le vocabulaire de À, 
décide si x € L(A). 


3 Décomposition des traces 


Propriété 3.1 Soient À un automate fini de vocabulaire V, x et y deux chaînes sur V, p et q deux états de À. 
Un chemin mène de p à q avec la trace xy si et seulement si il existe un état r tel qu’un chemin mène de p à r avec la 
trace x et de r à q avec la trace y. 


Preuve : La condition suffisante est évidente et nous prouvons seulement la condition nécessaire. Soit un chemin 
(ri,ain1,ri1) pour à de O0 à n — 1 menant de l’état p à l’état g avec la trace xy. Puisque les symboles de chaque 
transition sont éléments de V ou sont égaux à €, il existe k tel que 0 < k < net x = a ...ag. Par suite, il y a un chemin 
conduisant de p à r, avec la trace x et de r4 à qg avec la trace y. 


Propriété 3.2 Soient À un automate fini de vocabulaire V, a un élément de V et p,q deux états de À. Il y a un chemin 
de trace a entre p et a, si et seulement si il existe deux états r et s tels que, un chemin de trace £ mène de p à r, (r,a,s) 
est une transition et un chemin de trace £ mène de s à q. 


On laisse au lecteur le soin de rédiger cette preuve. 


4 Automates finis sans £-transition 
Théorème 4.1 Tout automate fini est équivalent à un automate fini sans € transition 


Preuve : Soit À —=< Q,V,6,1,F > un automate fini. 
Soit B=< Q,V,1n,1,G > l’automate fini sans € transition ainsi défini : 
— Pour tout a € V, pour tous p,q € Q, 
(p,a,q) En si et seulement si il existe un état r avec un chemin de À de trace £ conduisant de p à r et (r,a,q) € Ô. 
- G=FU{peQ\| il y a un chemin de trace £ entre p et un état de F} 
On peut décrire autrement la construction de B : 
— Pour tout p € Q, soit f(p) = {q € Q | il y a un chemin de trace € entre p et q} 
— Pour tout a € V, pour tout p € Q,n(p,a) =U,er(p) Ô(r,4) 
- G=FU{pEQ|f(p)NF #0} 
Prouvons que les automates À et B sont équivalents. 
On montre tout d’abord la propriété P(x) suivante : 


Il existe un chemin de À de trace x entre l’état p et l’état g si et seulement si il y a un état r et un chemin 
de B menant de p à r avec la trace x et un chemin de À menant de r à qg avec la trace €. 


On procède par induction sur la longueur de x. 

Pour x = &, P(x) est vérifiée en choisissant r = p. Supposons P(x) vraie et montrons P(ax) pour a € V. 

Il a un chemin de À de trace ax entre p et q 

si et seulement si (d’après la Propriété[3.1} il existe un état f tel qu’un chemin de À mène de p à f avec la trace a, et un 
chemin de À mène de f à g avec la trace x 
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si et seulement si (d’après la Propriété [3.2} il y a des états r,s,t tels qu’un chemin de À de trace £ mène de pàr, 
(r,a,s) € Ô, un chemin de À de trace £ mène de s à r, et un chemin de À de trace x mène de f à q 

si et seulement si (par définition de B) il y a des états s,f tels que (p,a,s) € n, un chemin de À de trace € mène de s à 
t, et un chemin de À de trace x mène de f à q 

si et seulement si (par définition des traces) il y a des états s,f tels que (p,a,s) € n, un chemin de À de trace x mène de 
sàq 

si et seulement si (d’après l'hypothèse d’induction) il y a des états s,u tels que (p,a,s) € n, un chemin de B de trace x 
mène de s à w et un chemin de À de trace € mène de u à q 

si et seulement si (par définition des traces) il y a un état u tels que un chemin de B de trace xa mène de p à u et un 
chemin de À de trace £ mène de u à q 

Ce qui établit la propriété P(ax), donc prouve P(x) pour toute chaîne x. 

On en déduit l’équivalence des deux automates. Soit x € V*: 

xE L(A) 

si et seulement si il y a un chemin de À de trace x entre un état initial et un état final de À 

si et seulement si (d’après la propriété P(x)) il existe un état r et un chemin de B de trace x entre un état initial de B et 
r et un chemin de À de trace & entre r et un état final de A 

si et seulement si (par définition des états finals de B) il y a un chemin de B de trace x entre un état initial et un état 
final de B 

si et seulement si x € L(B) 


Exemple 4.1 On élimine les £ is de AO A ci-dessous, ayant pour vocabulaire {0, 1,2} : 
0 


GB .8 


Pour chaque état s, on calcule f(s) l’ensemble des états atteignables avec la trace & : 


s | f(s) 

p | {p,qr} 
g | {ar} 

r |{r} 


Puisqu'il y a des chemins de trace £ entre p et l’état final r ainsi qu'entre q et r, ces deux états deviennent aussi des 
états finals. 

La fonction de transition de l’automate sans £ est présentée sous forme d’une table dont les cases sont les valeurs de 
n(s,a) pour chaque état s et symbole a. 

0 1 2 
p|t{r}|ta}]t} 
qg|9 |{a}lt} 
r | 0 0 {r} 


Dessinons ce même automate : 


5 Automates finis déterministes 
Définition 5.1 (automate déterministe) Un automate fini déterministe est un automate fini < Q,V,6,1,F > n'ayant 
qu'un éfat initial, sans £-transition, tel que pour tout état p et tout symbole a (un symbole est un élément de V), il y a 


un et un seul état q tel que (p,a,q) € à. 


Dans la description d’un tel automate, l’ensemble I des états initials est remplacé par son seul état. Soit p un état et 
a un symbole, puisqu'il n’y a qu’un seul état g tel que (p,a,q) € à, on note cet état par Ô(p,a) et on voit Ô comme 
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une application de Q x V dans Q. Avec ce formalisme, la fonction à est donc totale. Il est possible de trouver dans la 
littérature des formalismes où à est une fonction partielle, c’est-à-dire que pour tout p € Q et a € V, il existe au plus 
un état tel que (p,a,q) € à. 


Définition 5.2 (extension de la fonction de transition) Soir à : Q XV + Q la fonction de transition d’un automate 
déterministe. 
Soit 8 :QxXV*+ Q la fonction ainsi définie : 

— Ô*(p,E) — p pour tout p E Q 

— Ô*(p,ax) = Ô*(ô(p,a),x) pour tout pE Q,aE V,xE V* 
Remarquons que pour p un état et a un symbole, &*(p,a) = 8*(à(p,a),£) = ô(p,a). Donc la fonction Ô* est une 
extension de à et dans la suite nous ne distinguerons plus ces deux fonctions, et noterons à à la place de &*. 


Exemple 5.1 L'automate À dessiné ci-dessous est un automate déterministe sur le vocabulaire {0,1} : de chaque état 
part une et une seule O-transition ainsi que une et une seule 1 transition. 
0 0 


7 
——®© fr) 
1 
L(A) est l’ensemble de chaînes ayant un nombre pair de 1. Notez le choix du nom des états : toute trace d’un chemin de 
l’état pair à l’état pair comprend un nombre pair de 1, toute trace d’un chemin de l’état pair à l’état impair comprend 
un nombre impair de 1. 


Propriété 5.1 Soir Ô: Q XV + Q la fonction de transition d’un automate déterministe. Soient p, q deux étatx et x € V*. 
Ô(p,x) — q si et seulement si il y a un chemin de trace x menant de p à q. 


La preuve est immédiate par induction sur la longueur de x. 
Propriété 5.2 Soit À =< Q,V,ô,i,F > un automate déterministe. L(A) = {x € V*|ô(i,x) e F} 


Preuve : Soit x € V*. D’après la propriété [5.1]: 
Ô(i,x) € F si et seulement si il y a un chemin de trace x entre l’état initial et un état final de À. 
D’après la définitionf.3] cela veut dire que x € L(A). 


Propriété 5.3 Soit à : Q x V — Q la fonction de transition d’un automate déterministe. Pour tout état p € Q et toutes 
chaines x,y € V*, on a : Ü(p,xy) = 8(Ô(p,x), y). 


Preuve : On procède par induction sur la longueur de x. 
Pour x — €, d’après la définition[5.2] Ô(Ô(p,x),y) = 8(p,y). Puisque y = xy, on a bien : (p,xy) = 6(8(p,x),y). 
Supposons l'égalité vérifiée pour x et montrons qu’elle reste vérifiée pour la chaîne ax où a € V : 
Ô(p,axy) = Ô(8(p,a),xy) Par définition 
Ô(Ô(p,a),xy) = 8(8(8(p,a),x),y) Par hypothèse d’induction 
S((8(p,a),x),y) — 8(8(p,ax),y) … Par définition|s 2] 
Donc 5(p,axy) = Ô(Ô(p,ax),y) 


Définition 5.3 (État accessible, automate connecté) Soit A =< Q,V,ô,i,F > un automate fini déterministe. L'état 
p est accessible si et seulement si il y une chaîne x € V* telle que p = 8(i,x). Un automate dont tous les états sont 
accessibles est dit connecté. 


Exercice 5.1 Écrire un algorithme calculant les états accessibles d’un automate fini déterministe. 


Théorème 5.1 (Élimination des états inaccessibles) Tout automate fini déterministe est équivalent à un automate 
Jini déterministe connecté. 


Preuve : Soit À —=< Q,V,6,i,F > un automate fini déterministe et R l’ensemble de ses états accessibles. 
L’automate B , obtenu en supprimant les états inaccessibles, où B—< R,V,n,i,RNF >oùn=ôn(RxVXR),estun 
automate fini déterministe connecté équivalent à À. 
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1. L’automate B est déterministe. 
Puisque l’automate À est déterministe, pour tout état p € R, tout symbole a € V, il y a au plus un état ge Rtel 
que (p,4,q) En. 
Montrons qu’il y a au moins un tel état. Soit p € R et a € V. Puisque p est accessible, il existe une chaine x 
telle que Ô(i,x) = p et par la propriété [5.3]de l'extension de 6, on a Ô(p,a) = G(8(i,x),a) = Ô(i,xa). Donc l’état 
Ô(p,a) est aussi accessible et (p,a,Ô(p,a)) EN. 
Par suite n est une fonction de R x V dans R. 
2. L’automate B est connecté. 
D’après la preuve ci-dessus, Ô et n sont identiques sur le domaine R x V, donc par une induction triviale, elles 
sont aussi indentiques sur le domaine R x V*. 
Soit p € R, puisque p est accessible dans À, il existe une chaîne x telle Ô(i,x) — p. Puisque 6 et n sont identiques 
sur le domaine R x V*, n(i,x) — p, donc p est accessible dans B. 
Donc tous les états de B sont accessibles : B est connecté. 
3. Les automates À et B sont équivalents. 
x € L(A) 
si et seulement si ô(i,x) € F D’après la propriete 
si et seulement si Ô(i,x) ERNF Car l’état Ô(i,x) est accessible, donc élément de R 
si et seulement si n(i,x) ERNF Car 8 et n sont identiques sur le domaine R x V* 
si et seulement si x € L(B) D’après la propriete F 


Exercice 5.2 Écrire un algorithme calculant un automate détermiste connecté équivalent à un automate déterministe 
donné. 


6 Construction des automates déterministes 


Théorème 6.1 Tout automate fini sans £ transition est équivalent à un automate déterministe. 


Preuve : Soit À —< Q,V,6,1,F > un automate fini sans €-transitions. 
Soit B=—< P(Q),V,n,1,G > l’automate fini déterministe, ayant / comme état initial et défini par : 
n(P,a) =U,epÔ(p,a) pour PCQ,aeV G={P|PCQOetPNFZ£0} 
Prouvons que ces deux automates sont équivalents. 
Soit f : P(Q) x V* =: P(Q) ainsi défini : 
f(P, x) est l’ensemble des états g € Q tels qu’il y a un chemin de trace x entre un élément de P et q. 
Nous montrons d’abord que les fonctions f et sont identiques. 
1. Pour tout PC Q,a€ V,xEe V*,ona f(P,ax) = f(n(P.a),x). En effet 
q € f(P,ax) 
si et seulement si il existe p € P,r € Q,un chemin Par définition de f 
de À menant de p à r de trace a et un chemin de À 
menant de r à g de trace x 
si et seulement si il existe pE Pr E Q,rEG(p,a) Parce que À n’a pas d’e-transition 
et un chemin de À menant de r à g de trace x 
si et seulement siilexister En(P.a)etunchemin Par définition den 
de À menant de r à g de trace x 
si et seulement si g € f(n(P,a),x) Par définition de f 


2. On montre que pour tout P C Q,xE V*,ona f(P,x) =n(P.x) par induction sur x. 
Pour x — €, l’égalité est vérifiée, car en absence d’e-transition, f(P.x) = P et par définition des extensions 


n(2.x) = P. 

Supposons la propriété vérifiée pour la chaîne x. Montrons qu’elle est aussi vérifiée par la chaîne ax où a € V. 
f(P,ax) = f(n(P,a),x) D’après la propriété ci-dessus 
fin(P,a),x) = n(n(e a),x) Par induction 
n(n(P,a),x) = n(P,ax) Par la définition[S.2 
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3. Montrons l’équivalence des deux automates. Soit x € V*. 
x € L(A) 
si et seulement si il y a un chemin de trace x entre Par la définition|2.3 
un état initial et un état final de A 


si et seulement si f(/,x)NF Z 0 Par définition de 
si et seulement si f(1,x) € G Par définition de G 
si et seulement si n(Z,x) € G Puisque, d’après/2] les fonctions f et n sont égales 


si et seulement si x € L(B) Car G est l’ensemble des états finaux de B 


Exemple 6.1 Soit À —< Q,V,,1,F > l’automate fini suivant, où V = {0,1} : 
0,1 


Ci 0 0 

(P) (9) 
L(A) est l’ensemble des chaînes sur {0,1} terminées par 00. 
Soit B =< P(Q),V,n.1,G > l’automate déterministe construit comme il est indiqué dans le théorème{G. T]ci-dessus. 
Nous représentons B par une table, puis nous dessinons l’automate obtenu en supprimant les états inaccessibles de B. 


accessibles | statut | états 0 1 


") ") 0 

(a) initial | {p} {p,q4} | {p} 
{a} {r} 0 
final _ | {r} () 0 

(b) {p,q4} | {p,g;r} | {p} 


final} {p;r} | {p,q} | {p} 
final {q,r} {r} ()] 
(c) final | {p,g;r} | {p,g;r} | {p} 
Seuls les états (a), (b), (c) sont accessibles, aussi en pratique on construit l’automate déterministe équivalent à À en 
partant de son état initial {p} et on ajoute les nouveaux états au fur et à mesure qu'ils sont accessibles donc on ajoute 
les lignes (b) et (c) sans construire les cinq lignes inutiles des états inacessibles. 
Après suppression des états inaccessibles (voir propriétéF.1), l’automate B est équivalent à l’automate déterministe 
ci-dessous, correspondant aux trois lignes (a), (b) et (c) : 


—Ëre 6 


1 


Remarque 6.1 L’automate B, dont la construction est décrite dans la preuve du théorème [6.1] comporte, en général, 
beaucoup d'états inaccessibles. Plutôt que d'introduire ces états puis de les éliminer, on construit la fonction de 
transition de B en partant de son état initial et en ajoutant uniquement les états accessibles depuis cet état. 


Corollaire 6.1 Tout automate fini est équivalent à un automate fini déterministe connecté. 


Preuve : D’après le théorème ff.TJun automate fini est équivalent à un automate fini sans e-transition. 

D’après le théorème. [[un automate fini sans e-transition est équivalent à un automate déterministe. 

D’après le orme un automate fini déterministe est équivalent à un automate fini déterministe connecté. 

Ce qui termine la preuve : notez que les constructions de ces automates sont décrites dans les preuve des théorèmes 
indiqués. 


Exercice 6.1 1. Montrez que le complémentaire d’un langage d'états finis est aussi d’états finis. 
Indication : utiliser le fait qu'un automate fini est équivalent à un automate déterministe. 
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2. Montrez que l'intersection de deux langages d'états finis et aussi d’états finis. 
Indication : étant donnés deux automates déterministes A1 —=< Qi,V,ô1,ü,F1 > et A2 =< Q3,V,02,i2,P> >, 
construire un automate ayant pour ensemble d'états Q1 x Q2 et qui effectue simultanément les transitions de A; 
et À). 


3. Montrez que l’union de deux langages d'états finis et aussi d'états finis. 


7 Machines de Mealy et de Moore 


Les machines étudiées dans cette section sont des automates finis déterministes munis de sorties. Ces machines 
sont très importantes car elles modélisent le fonctionnement des processeurs, qui changent d’états en fonction des 
signaux d’entrée et produisent des signaux en sortie. 

Avec des sorties associées aux transitions, on obtient les machines de Mealy. Lorsque les sorties sont associées aux 
états, on obtient les machines de Moore. 
Les automates finis déterministes peuvent être vus comment des cas particuliers de ces machines. 


Définition 7.1 (Machine de Mealy) Une machine Mealy est un sextuplet À =< Q,V,W,i,0,s > où 

— Q est un ensemble fini d'états 

— V est le vocabulaire d’entrée 

— W est le vocabulaire de sortie 

— 1€ Q est l’état initial 

— Ê:Q XV Q est la fonction de transition 

— s:QOXV-W est la fonction de sortie 
La fonction à est étendue en une fonction de Q X V* dans Q comme dans le cas des automates déterministes, on 
rappelle que : 


Ô(p,E) = p pour p € Q 

Ô(p,ax) = Ô(8(p,a),x) pour p € Q,a € V,xE V* 
La fonction s est étendue en une fonction de Q x V* dans W* avec : 

s(p,E) = E pour pE Q 

s(p,ax) = s(p,a)s(8(p,a),x) pour p E Q,a € V,xE V* 


Soit sa : V* + W* la fonction définie par sa(x) = s(i,x). 

Cette fonction est la fonction (d’entrée-sortie) calculée par A. 

Deux machines de Mealy (ayant même vocabulaire d’entrée et même vocabulaire de sortie) sont équivalentes si elles 
calculent la même fonction d’entrée-sortie. 


L'état initial d’une telle machine est noté comme celle d’un automate fini. La fonction de transition et la fonction 
d’entrée-sortie sont notées avec les conventions suivantes : 


O0 signifie que Ô(p,a) = get s(p,a) =b 


Exemple 7.1 On trouve un premier exemple de machine de Mealy en [7.3] avec un additionneur binaire. Nous le 
redonnons ici : 


11/0 

00/0 01/0 

O1/1 (0) 10/0 

19/1 11/1 
00/1 


La machine a deux états s (pas de retenue) et r (retenue). Son vocabulaire d'entrée est V — {00,01,10,11}, son 
vocabulaire de sortie est W = {0,1}. 

Pour ajouter 110 (6 en décimal) et 110, on donne le mot d'entrée 00.11.11 dans lequel les unités sont mises à gauche 
et le point est utilisé pour séparer les symboles d'entrée. 
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Appelons À cette machine, avec les même notations que dans la définition ci-dessus. On a : 
sA(00.11.11) = O0! er ô(s,00.11.11) = r. Autrement dit la somme vaut 1100 (12 en décimal), le 1 en tête venant de la 
retenue et 100 venant de la sortie retournée. 


Propriété 7.1 Soit < Q,V,W,i,0,s > une machine de Mealy. Pour tous p € Q,x,y E V*, on a: 
s(p,xy) = s(p,x)s(8(p,x),y) 


Exercice 7.1 Prouver la propriété ci-dessus. 


Définition 7.2 (Machine de Moore) Une machine Moore est un sextuplet À =< Q,V,W,i,0,s > où 
— Q est un ensemble fini d'états 
— V est le vocabulaire d’entrée 
— W est le vocabulaire de sortie 
ie Q est l’état initial 
— 8: Q XV Q est la fonction de transition 
— s:Q- W est la fonction de sortie 
La fonction s est étendue en une Q X V* dans W* avec : 
s(p,E) = s(p) pour p € Q 
s(p,ax) = s(p}s(ô(p,a),x) pour p € Q,a € V,x € V* 
La fonction d’entrée-sortie calculée par A est définie comme pour la machine de Mealy, en démarrant la machine à 
partir de son état initial. L’équivalence entre deux machines de Moore est définie comme pour les machines de Mealy. 


Exercice 7.2 Soit A —< Q,V,i,0,F > un automate fini déterministe. Définir une machine de Moore B—<Q,V,{0,1},i,6,s > 
telle que pour toute chaîne x € V*, x est reconnu par À si et seulement si sp(x) est une chaîne qui se termine par 1. 


Cet exercice montre que les automates finis déterministes peuvent être vues comme des machines de Moore partic- 
ulières. 
Nous montrons aussi comment passer d’une machine de Moore à une machine de Mealy et inversement. 


Théorème 7.1 (De Moore à Mealy) Soit A —=< Q,V,W,i,Ô,s > une machine de Moore. 
Soit B—< Q,V,W,i,,t > la machine de Mealy telle que : pour tout p € Q,a € V,t(p,a) = s(ô(p,a)). 
Pour tout p € Q,x € V*, nous avons : s(p,x) = s(p}t(p,x). 


La preuve est laissée en exercice. 


Théorème 7.2 (De Mealy à Moore) Soit À —< Q,V,W,i,0,s > une machine de Mealy. La transformation en une 
machine de Moore est résumé par le schéma suivant : 


Machine de Mealy Machine de Moore 


®) a/b (a) a à 


Autrement dit, le symbole b, que la machine de Mealy doit écrire en lisant a dans l’état p, est mémorisé dans l’état 
(q,b) de la machine de Moore qui écrit b dans cet état. Formalisons cette construction. 
Soit B=—<@QxV,V,W,(i,a),n,t > la machine de Moore suivante : 
— l’état initial est (i,a) où a € V est un symbole quelconque 
— N((p,a),b) = (ë(p,b),s(p,b)) pour p € Q, a,b € V : la transition de la machine de Mealy est effectuée et le 
symbole qu’elle devait écrire lors de cette transition est mémorisée. 
— t((p,a)) = a pour pE Q,a € A 
Pour tout p € Q,a € V,x € V*, nous avons :t((p,a),x) = as(p,x) 


La preuve est laissée en exercice. On note que cette transformation multiplie le nombre d’états de la machine de Mealy 
par le nombre de symboles du vocabulaire d’entrée. 
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Chapitre V 


Equivalence des automates finis et des 
expressions régulières 


Ce chapitre est consacré à la démonstration du théorème : un langage est reconnu par un automate fini si et 
seulement si il est la valeur d’une expression régulière. La démonstration de ce résultat est constructive : elle définit 
des algorithmes de traduction des expressions régulières en automates finis équivalents et, pour la réciproque, de 
traduction des automates finis en expressions régulières. 


1 Tout langage régulier est reconnu par un automate fini 


Dans ce paragraphe sauf exception, on identifie une expression régulière et le langage qui lui est associé. 


Définition 1.1 (Automate simple) Un automate fini est simple s’il n’a qu'un état initial et qu'un état final, si aucune 
transition n'a pour extrémité cet état initial et si aucune transition n’a pour origine cet état final. 


Théorème 1.1 Tout langage régulier est reconnu par un automate fini. 


Preuve : On prouve la propriété suivante : 

(1) Soit e une expression régulière sur V. Il existe un entier & (où & > 2) et un automate simple À —< {1,2,...,0},V,6,{1},a> 
qui reconnait e. 

Nous montrons cette propriété par récurrence "structurelle" sur e. 

Si e — 0, l'expression est reconnue par l’automate simple : 


———{() 


Sie € VU {e}, l'expression est reconnue par l’automate simple : 
e 
Supposons que la propriété soit vérifiée par les expressions f et g. D’après cette hypothèse de récurrence, il existe 
deux entiers & et B où & > 2 et B > 2, un automate simple À =< {1,...,@4},V,,{1},{&} > reconnaissant f et un 
automate simple B=< {1,...,B},V,n,{1},{B} > reconnaissant g. et montrons qu’elle est vérifiée par e ayant l’une 
des formes f*, f +g, fg. 
1. case = f* 
Soit l’automate C—< {1,...,4+1},V,6,{1},{a+1} > où C'est obtenu, en «collant» l’état initial et final de À, 
c’est-à dire en changeant les états 1,...,0— 1,0 de l’automate À en les états 2,...,0,2, et en ajoutant les deux 
transitions (1,€,2) et (2,€,a+ 1). 
Plus précisément 
6 — {(p+l,ag+1)|(p,a,g)ebetq<a} 
U{(p + 1,a,2) | (p,a,a) € 5} 
U{(1,€,2),(2,€,a+1)} 
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Il est évident, en examinant €, que l’automate C est simple. Nous montrons que C reconnait e. 


Exemple 1.1 Le langage 010 est reconnu par l’automate simple 
D — 2) —— 5) — 


Avec la construction indiquée, le langage (010)* est reconnu par l’automate simple 


G) ; (4) 


() (2) 
On montre que L(C) = L(A)*. 


(a) L(A)* C L(C). 
On montre que C vérifie : 
(a) Si x € L(A) alors il y a un chemin de C de trace x de l’état 2 à l’état 2. 
En effet, soit x € L(A). Il existe n € N et une suite de transitions, (r;,4;11,r;:1) € Ô pour i de 0 à n — 1 telle 
que : ro = 1," =0,x=a]...an. 
Puisque l’automate À est simple, l’état & n’est l’origine d’aucune transition, donc pour i de O à n—1, 
1<r <@ 
Par définition de £, il en résulte que pour i de 0 à n —2, (r;,a;1,ri11) € G, et que (r,_1,a»,2) € €. 
Donc il y a un chemin de C de trace x de l’état 2 à l’état 2 : la propriété (a) est établie. 
Soit x € L(A)*. 
Il existe n € N tel que x = y1..….y, et pour i de 1 à n,y; € L(A). 
D’après la propriété (a), pour i de 1 à n, il y a un chemin de C de trace y; de l’état 2 à l’état 2, donc il existe 
un chemin s de C de trace x de l’état 2 à l’état 2. Par suite le mot x est reconnu par C grâce au chemin 
(1,€,2)s(2,€,a+ 1). Donc x € L(C). 


(b) L(C) C L(A)*. 
On montre par récurrence sur n que l’automate C vérifie ; 
(b) S’il y a un chemin de C de trace x et de longueur n entre l’état 2 et l’état 2, alors x € L(A)*. 
Supposons cette propriété vérifiée pour tout chemin de longueur inférieure à n. 
Soit un chemin de C de trace x et de longueur n entre l’état 2 et l’état 2. 
Il existe une suite de transitions (r;,a;+1,r;11) € & pour i de 0 à n — 1 telle que r0 = 2,7, —2,Xx = a1...@. 
Sin = 0 alors x = € donc x € L(A)*, ce qui prouve (b). 
Sin > 0 alors il y a un plus petit entier j tel que j > Oetr; —2. 
Puisque l’automate C est simple, ni l’état 1, ni l’état à + 1 ne figurent sur un chemin de l’état 2 à l’état 2. 
Donc par définition de €, pour i de O à j—2, (ri —1l,aii,rir1 — 1) € 8, et (rj_1,a;,@) € à. 
Ainsi il y a un chemin de À de trace a1 .….a; de l’état 1 à l’état ct, autrement dit ai ...a; € L(A). 
Par définition ÿj, il y a un chemin de C de longueur n — j, donc inférieure à n, entre l’état 2 et l’état 2 : par 
hypothèse de récurrence, a;,1,...,4n € L(A)*. 
Donc x = aj...an € L(A)". 


Ainsi L(C) = L(A)* = f* = e. Donc C reconnait e. 


. case = f +g. 

Soit l’automate C =< {1,...,0+B—2},V,6,{1},{a+fB—2} > où C est obtenu en «collant» d’une part l’état 
initial de À avec celui de B, et d’autre part l’état final de À avec celui de B. 

Ce collage est effectué en changeant l’état & de l’automate À en &+fB — 2 et en changeant pour i de 2 à f, l’état 
ideBeni+a—2. 
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Plus précisément 


6 — {(p,a,q)|(p,a,g) Eôetq <a} U{(p,a,a+$—2)](p,a,a) EG} 
U{(1,a,p+a—2) | (1,a,p) en} 
U{(p+a—2,a,q+a—2)](p,a,q)enetl<p} 


Il est évident que C est un automate simple. Nous montrons que C reconnait e. 
Exemple 1.2 Le langage 0* est reconnu par l’automate simple 
0 
Q— 6 
Le langage 101 est reconnu par l’automate simple 


)— —C)——)— —0) 


Avec la construction indiquée, le langage 0* + 101 est reconnu par l’automate simple 


(ù 


©) 


Un chemin de À de l’état 1 à l’état & devient après renommage des états un chemin de C de l’état 1 à l’état 
+ fB —2, un chemin de B de l’état 1 à l’état B devient aussi après renommage des états un chemin de C de l’état 
1 à l’état a+ PB —2. 

Donc L(A)UL(B) C L(C). 

Réciproquement puisque les automates À et B sont simples et que l’automate C est obtenu en «collant» d’une 
part l’état initial de À avec celui de B, et d’autre part l’état final de À avec celui de B, tout chemin de C, entre 
l’état 1 et l’état à + fB — 2, est, au nom près des états, soit un chemin de À de l’état 1 à l’état ot, soit un chemin 
de B de l’état 1 à l’état B. Donc L(C) = L(A)UL(B). 

Puisque L(A) = f,L(B) = g,ef +g, C reconnait e. 

. case = fg 
Soit l’automate C =< {1,...,4+fB—1},V,C,{1},{a+f—1} > où C est obtenu en «collant» l’état final de A 
et l’état initial de B. 

Pour i de 1 à $, l’état i de l’automate B devient i+@— 1. 

Plus précisement 


C un OU{(p+a—l,a,qg+a—1) | (P,a,q) en} 


Exemple 1.3 Le langage (0 + 1)* est reconnu par l’automate simple 
0,1 


()—— 2) — 
Le langage 00 est reconnu par l’automate simple 
()—— C2) — 


Avec la construction indiquée, le langage (0 + 1)*00 est reconnu par l’automate simple 
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OO oo 


Il est facile de prouver que L(C) = L(A)L(B). Puisque f = L(A),g = L(B),e = fg, l’automate C reconnait e. 


Exercice 1.1 Construire avec la méthode décrite dans la preuve ci-dessus, un automate fini simple reconnaissant 


((10)*1*)*. 


2 Tout langage reconnu par un automate fini est un langage régulier 


Dans la suite, pour dénoter les opérations sur les langages union, concaténation, on utilise les notations des expres- 
sions régulières. 


Théorème 2.1 (Résolution d’une équation) Soient à et B deux langages sur le vocabulaire V et x une variable. 
L'équation x = ox + $ a une solution x = &*B et cette solution est la plus petite des solutions de l'équation. 


Preuve : x = &*f est évidemment une solution car &*B = œ(@*B) + B. Montrons que c’est la plus petite des solutions. 
Soit x = L une autre solution. Par récurrence sur i € N, on montre que : 


1. Pour tout i, &'B C L 
(a) i=0. | 
On a : &'B — {e}B — $. Puisque L = aL+$, on a BC L. 
(b) i > 0. | | 
Supposons @/B C L. Puisque la concaténation est croissante, &*!B C aL. Puique L = àaL+f, on a +18 C 
L. Ce qui prouve] 
2. «BC L. 
Soit u € &*f. Par définition de l’étoile, il existe i € N tel que u € @/B. Donc d’après la propriété[1] ue L. 


Remarque 2.1 Les équations sur les langages peuvent avoir plusieurs solutions. 

Avec le vocabulaire V = {a}, l'équation x = x + a admet comme solutions tout langage L sur V tel que a € L. En effet 
sia€L, alors L= L+a. 

Avec le vocabulaire V = {a,b}, l'équation x = (a+£)x+ b a comme solutions tout langage a*(L+b) où L est un 
langage quelconque sur V. En effet (a +£)a*(L+b) +b = a*(L+b)+b = a (L+b). 

Avec le vocabulaire V = {a}, l'équation x = ax a comme unique solution x = 0. 


Définition 2.1 (Système régulier d’équations) Soit V un vocabulaire. Un système régulier de n € N équations sur V 
est un ensemble de n variables x1,...x, et de n équations où pouridelàn 


n 
= fit y OÙ, jX j 
j=1 
dont les coefficients oi; ; et B; sont des langages réguliers sur V. 
. gag 8 
Théorème 2.2 (Résolution d’un système régulier d’équations) Tout système régulier sur le vocabulaire V avec n 
variables x1,...x, admet une plus petite solution régulière, c’est-à-dire une solution x1 = Li,...,xn = Lh où L1,...,L, 


sont des langages réguliers sur V. 
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Preuve : On prouve ce résultat par récurrence sur n et la preuve est la recherche de la solution par la méthode de 
Gauss : la valeur de x, est calculée en fonction des valeurs des autres variables, puis la variable x, est éliminée, ce qui 
réduit le calcul à la recherche de la solution d’un système régulier à n — 1 variables. 

Soit S1 le système régulier où pouride làn 


n 
m = B+) ox; 
1 


1. n=l1. 


La seule équation du système est x1 = fi +1 1x1. D’après le théorème précédent P.1] cette équation a comme 
plus petite solution x1 = @ ,f1. 

Puisque 41 1 et Bi sont des langages réguliers, il en est de même de la valeur de x1. 

.n>l 

Supposons qu’un systeme régulier à n — 1 de variables x1,...x,_1 a une plus petite solution régulière. 

D’après le théorème précédent[2.1] si le système S1 a une solution, elle vérifie 


n—1 


An = OO n(Bn + Ÿ° On,iXj) 
j=l 


Remplaçons x, par sa valeur en fonction des variables x1,...x,-_1. On obtient le nouveau système S2 où pour à 
de làn—1 


n—] 
x = Pi+ d: œ xx) 
j=1 
avec pouridelàn—1 
B B: a Lin(Onn) Pr 
Gi; — Où; +Oin(Onn)"On,j 


Il est clair que ce système est régulier et par définition du système S2, nous avons : 

X—1=2),...Xn-1 = Ln-1,Xn = L, est la plus petite solution de S1 

si et seulement si 

Xx—1=2L,...Xn-1 = L,-1 est la plus plus petite solution de S2 

et Ly = 0 n(Bn + » On.jLi). 

Par hypothèse de récurrence, le système S2 a une plus petite solution régulière x1 = Li,...x,_1 = L,_1. Puisque 
L, est construit par les opérations union, concaténation, étoile appliquées à des langages réguliers, Z, est un 
langage régulier. 


Par suite S1 a une plus petite solution régulière. 


Exemple 2.1 Cherchons la plus petite solution du système suivant sur le vocabulaire {0, 1}. 


x —= Oxi+lx+E 
X2 — 1x sn Ox3 
x3 = 0x+1x 


D'après le théorème[£.1] la plus petite solution vérifie x3 = 1*Ox2. 
En reportant cette expression de x3 dans les deux premières équations, nous obtenons 


X1 


X2 


Ox: - 
1x; 7 


+ 1xo +E 
-01*Ox2 


D'après le théorème [2.1] la plus petite solution vérifie x1 — (01*0)* 1x1. 
En reportant cette expression de x2 dans la première équation, nous obtenons 


X1 


Ox1 + 1(01*0)* Lx +E 
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D'après le théorème [2.1] la plus petite solution en x1 est donc x1 = (0+1(01*0)*1)* +e = (0+1(01*0)*1)*. 
En reportant la valeur de x\ dans les équations x1 — (01*0)* 1x1 ef x3 = 1*Ox2, on obtient la plus petite solution (dont 
on verra au chapitre[K|qu elle est unique) : 


x —= (0+1(01*0)*1)* 
x —= (01*0)*1(0+1(01*0)*1)* 
x3 — 1*0(01*0)*1(0+1(01*0)*1)* 


3 Système d’équations associé à un automate fini 


Théorème 3.1 Soit À —< Q,V,6,1,F > un automate fini et q1,...,Qn une liste sans répétition des états de l’automate. 
Pour i de 1 à n, soit A; —< Q,V, 6, {qi},F > l’automate identique à À sauf que son unique état initial est qi. 
Soit pour tous les i, j entre L'tetn, Gi; = {ae VÜU{E}| (qi,a,q;) € 8}. 
Soient x1,...,x, une liste de n variables distinctes. 
Le système d'équations sur V défini pour i de 1 à n par 
siqieF x = E +) 1 x; 
siqiéF Xi = Le OijX 
a pour plus petite solution x1 = L(A1),...,Xn = L(An). 


Preuve : 


1. x] = L(A;),...,x1 = L(A;) est une solution du système. 
En effet u € L(A;) 
si et seulement si, par définition de À;, il y a un chemin de trace u entre g; et un état de F 
si et seulement si, par définition des traces, 


(a) soitu=eetger 
(b) soit il y a un chemin avec au moins une transition de trace u entre g; et un état de F 
si et seulement si, par définition des traces, 
(a) soitu=eetger 
(b) soit il y a un entier j entre 1 et n, un symbole a et une chaine v tels que u = av,a € 0 ;,v € L(A;) 
Par suite 
sideF L(A;j)= Ee+} Où, jL(A ;) 
siq@F L(4)=X" 0;L(A;) 
Ce qui prouve la propriété [1] 


2. x1 = L(A;),...,xn = L(A;) est la plus petite solution. 
Soit x = M:,...,x, = M, une solution du système. 
Soit L; ; l’ensemble des chaines u € V* telles que il y a un chemin de longueur j et de trace u entre l’état q; et 
un état de F. 
Soit P() la propriété : pour i de 1 à n, Li; C M; 
On montre d’abord que P(j) est vraie pour tout j € N. 
Par définition des L; ;, nous avons 


SgieF Lio = {e} 
siqéFr Lio = 0 


Puisque x1 = Mi,...,x1 = M, est une solution du système, pour i de 1 à n, si gi € F alors e € Mi. 
Par suite pour i de 1 à n, Lio € Mi. 
Ce qui prouve P(0). 
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Supposons P(j) vérifiée et prouvons P(j+1). 
Par définition des L; ; et des ti; ;, nous avons 


n 
Lun = Yo; (V.1) 
k=1 


Par hypothèse de récurrence L} ; € My, donc Gi Lx ; € @xMy. 
De l’égalité[V.T]et de cette dernière inégalité, il résulte que : 


n 
Lijn € } M (V2) 
k=1 
Puisque x1 = Mi,...,xn = M, est une solution du système, il en résulte que pouri de làn 
n 
œxMy € M; (V3) 
k=1 
Des inégalités [V]et[V] il résulte que pour i de 1 à n 
Lijh € Mi 


Ce qui montre que la propriété P(j) est vraie pour tout j € N. 

Il nous reste à prouver que pour i de 1 à n, L(A;) C Mi. 

Soit u € L(A;). Par définition des L; ;, il existe j tel que j >>Oetue Li. 
D’après la propriété P(j), pour tout i € N,L;,; C M: 

Donc u € M;. 

Par suite x] = L(A1),...,x, — L(A,) est bien la plus petite solution du système. 


Exemple 3.1 Soit À l’automate ci-dessous 
0 1 


0-00) 
1 0 
Cet automate déterministe reconnait les chaines binaires représentant un nombre écrit en base 2 et divisible par 
3. Pour le prouver, il faut associer les états 0,1,2 aux nombres binaires égaux respectivement à 0,1,2 modulo 3 et 
remarquer que le corps Z/3Z on a 
— 2k0+0—=0,2x0+1 = 1, ce qui «explique» les flêches sortant de l’état 0 
— 2*x1+0—=2,2*x1+1—0, ce qui «explique» les flêches sortant de l’état 1 


— 24x2+0—=1,2*x2+1 =, ce qui «explique» les flêches sortant de l’état 2 
D'après le théorème. Ton associe à cet automate le système 


x = Oxi+lm+Ee 
X2 — 1x Sn 0x3 
x3 —= O0x+ilx 


dont les variables x1,x2,x3 correspondent respectivement aux états 0, 1,2 
dont la plus petite solution vérifie x1 = L(A). 
Nous avons déjà trouvé cette solution à l’exemple[Z.T|donc L(A) = (0+1(01*0)*1)*. 


Théorème 3.2 Tout langage reconnu par un automate fini est un langage régulier. 
Preuve : Soit À —< Q,V,,1,F > un automate fini. Soit g1,...,q, une liste sans répétition des états de l’automate. 
Pour i de 1 à n, soit A; —< Q,V,,{qi},F >. 


Par définition des automates A;, on a : L(A) = Ÿ ii que ger L(Ai)- 
D’après le théorème [3.1] on associe à l’automate À un système régulier (ses coefficients sont des langages finis) dont 
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les variables correspondent respectivement aux états g1,...,g, et dont la plus petite solution est 

x = L(A;),...,X%n = L(A;). 

D’après le théorème [2.2] le systeme étant régulier, sa plus petite solution est régulière, donc les langages L(A;) sont 
réguliers. 

Puisque L(A) est une somme finie de ces langages, L(A) est un langage régulier. 


Théorème 3.3 Un langage est reconnu par un automate fini si et seulement si il est défini par une expression régulière. 


Preuve : D’après le théorème ci-dessus un langage reconnu par un automate est régulier. 
Réciproquement d’après le théoreme un langage régulier est reconnu par un automate. 
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Chapitre VI 


Automates finis déterministes minimaux 


Ce chapitre est consacré à la minimisation des automates finis déterministes. Un automate déterministe est minimal 
si tout automate déterministe qui lui est équivalent comporte au moins autant d’états. Notre étude est divisée en deux 
parties 

— Construction de l’automate minimal, ce qui est le résultat intéressant en pratique. 

— Unicité (au nom près des états) de l’automate minimal. Comme ce résultat est intéressant en théorie, nous en 

donnerons deux preuves, en espérant que le lecteur en étudiera au moins une. 
Ces résultats s’étendent aux machines de Mealy et de Moore (définies au paragraphe[/]du Chapitre[TV} et nous laissons 
cette étude en exercice. 
Comme dans ce chapitre, tous les automates sont finis et déterministes, nous nous abstiendrons, sauf exception, de le 
rappeler. 


1 Construction de l’automate minimal 


Définition 1.1 (Équivalence entre les états) Soit À —< Q,V, 6, i,F > un automate. Soit p un état de cet automate. On 
note À, l’automate < Q,V,ô,p,F >. Deux états p et q sont équivalents si les deux automates À, et À, sont équivalents. 
On note =A l’équivalence associée à l’automate À, l'indice À pouvant être omis quand il n’y a pas d’ambiguité. 


Propriété 1.1 (De l’équivalence entre les états) Soit À —< Q,V, à,i,F > un automate. 


1. Les états p et q sont équivalents si et seulement si 
pour toute chaine x € V*, 6(p,x) € F si et seulement si 8(q,x) € F 


2. Si les états p et q sont équivalents, alors pour toute chaine x € V*, les états 8(p,x) et 8(q,x) sont équivalents 


Preuve : 


1. Les états p et q sont équivalents si et seulement si L(A,) = L(A,). 
D’après la propriété[5.2] L(A,;)={xe V*|ô(p,x) EF} =L(A,)={xeV*|ô(g,x) EF}. 
Par suite p et q sont équivalents si et seulement si 
pour toute chaine x € V*, ô(p,x) € F si et seulement si 6(g,x) € F. 


2. Supposons que les états p et g sont équivalents. Pour montrer que pour toute chaine x € V*, les états Ô(p,x) et 
Ô(q,x) sont équivalents, il suffit, d’après la propriété ci-dessus [1] de prouver que : 
pour toute chaine y € V*, Ô(Ô(p,x),y) € F si et seulement si Ô(0(g,x),y) € F. 
Ô(8(p,x),y)€ F si et seulement si, d’après la Propriété eu chapitre [IV] 


Ô(p,xy)€F si et seulement si , sachant que p et qg sont équivalents et d’après la propriété ci-dessus [1] 
Ô(g,xy) € F si et seulement si, d’après la propriété [5.3]au chapitre [IV] 
Ô(8(p,x),y) € F 


Pour minimiser un automate À, on procède en deux étapes 
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— on enlève les états inacessibles depuis l’état initial (voir le théoremef.1}. 
— on identifie les états équivalents 
Nous précisons cette deuxième étape : 
— nous montrons qu’elle change un automate connecté, c’est à dire sans états inacessibles, en un automate connecté 
équivalent. 
— nous décrivons, dans le paragraphe f?] comment calculer la relation d’équivalence entre états 
Dans le paragraphe] nous prouvons que l’automate B ainsi obtenu est l’automate minimal équivalent à À : 
— iln’y a pas d’automate équivalent avec moins d’états 
— tout autre automate minimal équivalent est, au nom des états près, identique à B 


Notation 1.1 Soit p une relation d'équivalence sur un ensemble À et a € A. La classe d'équivalence de a pour la 
relation p est notée |a],, l'indice pouvant être omis quand le contexte le permet. 


Définition 1.2 (Indentification des états équivalents) Soir À —< Q,V, 6,i,F > un automate et =A l’équivalence en- 
tre états associée à l’automate. On associe à À l’automate m(A) =< R,V,n, [il=,,R > où 
— Rest l’ensemble des classes d'équivalence de la relation =A 


— pour tout p € Q, a € V, N([pl=,a) = [8(pa)]-, 
— Gest l’ensemble des classes d'équivalence des états de F 


Notons que l’application n est bien définie, car, d’après la propriété P] si les états p et g sont équivalents, il en est de 
même des états Ô(p,a) et ô(q,a), où a € V. 


Propriété 1.2 (Équivalence de A et m(A)) On reprend les notations ci-dessus sauf que l’on omet de rappeler l’équiv- 
alence entre états. L'automate m(A) vérifie 


1. pour tout p € Q, x E V*,n([p},x) = [ô(p,x)] 
. pour tout pE Q,pEF si et seulement si [p] € G 
. les automates À et m(A) sont équivalents 


. deux états équivalents de m(A), pour l’équivalence associée à m(A), sont identiques. 


U OR L& N 


. si À est connecté alors m(A) est connecté. 


Supposons que À est connecté. La propriété ci-dessus montre non seulement que les automates À et m(A) sont équiva- 
lents mais aussi, qu’il est impossible, par la même construction appliquée à m(A), de réduire le nombre d’états de cet 
automate. 

Preuve : 


1. Prouvons que n({p],x) = [8(p,x)]. On prouve la propriété par induction sur x. 
Pour x = €, n([p],x) = [p] = [$(p,x)] par définition des extensions de n et 6. 
Supposons que pour tout p € Q, n([p],x) = [ô(p,x)] et soit a € V. Montrons que n([p],ax) = [ô(p,ax)]. 
n({p],ax) =n(n({pl,a),x) par définition de l’extension de n 
n(n((pl,a),x) = n([8(,a)],x) par définition de 
n([ô(p,a)],x) = [8(8(p,a),x)] par hypothèse d’induction 
[8(8(p,a),x)] = [8(p,ax)] par définition de l’extension de à 
2. Montrons que p € F si et seulement si [p] € G. 
Par définition de G, si p € F alors [p] € G. 
Réciproquement supposons [p] € G. Par définition de G, il existe un état g équivalent à p, tel que q € F. 
En particulier, d(g,E) = q € F, et comme p est équivalent à q, Ô(p,E) — p est également dans F d’après la 
propriété [T.2] 
3. les automates À et m(A) sont équivalents 
x € L(A) 
si et seulement si ô(i,x) € F Par définition de A 
si et seulement si [ô(i,x)] € G Par la propriété ci-dessus] 
si et seulement sin(li],x) € G  Parla propriété 1] 
si et seulement si x € L(m(A)) Par définition de m(A) 
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4. Montrons que deux états équivalents de m(A), pour l’équivalence associée à m(A), sont identiques. 
Soient p et g deux états de À. 
[p] et [g] sont équivalents pour m(A) 
si et seulement si pour tout x € V*, n([p],x) € G si et seulement si n([g],x) € G d’après la propriété 
si et seulement si pour tout x € V*, [ô(p,x)] € G si et seulement si [ô(g,x)] € G d’après la propriété |] 
si et seulement si pour tout x € V*,ô(p,x) € F si et seulement si Ô(q,x) € F d’après la propriété [2] 
si et seulement si pour tout x € V*, [p] — [q| d’après la propriété 


(1) 


5. Supposons À connecté, montrons qu’il en est de même de m(A). 
Soit [p] où p € Q, un état quelconque de m(A) 
Puisque À est connecté, il existe x € V* tel que Ô(i,x) = p 
D’après la propriété|1] n([i,x) = [p|, donc [p] est accessible. 


2 Calcul de la relation d’équivalence entre les états d’un automate 


Soit À un automate. La construction de l’automate minimal équivalent à À a été décrite au paragraphe précédent. 
Pour achever cette construction, nous montrons comment calculer la relation d'équivalence entre les états de À. Pour 
calculer cette relation, on en construit une suite d’approximations. 


Définition 2.1 (Approximations de l’équivalence entre états) Soit À —< Q,V, 6,i,F > un automate. 

Pour tout k € N, la relation =4 est définie ainsi : 

pour tous p,q € Q, p =K q si et seulement si pour toute chaine x € V* de longueur au plus k, ô(p,x) € F équivaut à 
Ô(g,x) EF. 


Il est évident que la relation=+ est une relation d'équivalence. 


Propriété 2.1 (Relation entre les approximations de l’équivalence =) Soit À le même automate que ci-dessus. 


1, = —- ken —=k. 


2. PourtoutkE N,=y:1C=y 

3. Pour tous p,q € Q, p =0 q si et seulement si p,q € Foup,qé&#F 

4. Pour toutkE N,p,q € Q, p =x11 q si et seulement si (p =K q et pour tout a € V,(p,a) = Ô(q,a)) 
5. Soit n le nombre d'états de l’automate À, il existe un entier k tel que k <n et =y = =y11 = = 


Preuve : Les trois premières propriétés sont évidentes et nous montrons seulement les deux dernières. 


— Prouvons que p =}4:1 q si et seulement si (p =, q et pour tout a € V,ô(p,a) = Ô(q,a)). 


1. Prouvons l’implication de gauche à droite. Soient p et g deux états tels que p =x+1 q. 
Puisque =}:1C=y, On à p =+4 q. 
Par définition de la relation =;}1, on a : pour tout a € V, pour toute chaine x € V* de longueur au plus k, 
Ô(p,ax) € F si et seulement si ô(g,ax) € F. 
Ce qui s’écrit encore : pour tout a € V, pour toute chaine x € V* de longueur au plus k, ô(ô(p,a),x) € F si 
et seulement si ô(Ô(q,a),x) € F. 
Donc par définition de =}, pour tout a € V, Ô(p,a) =K4 Ô(q,a). 


2. Prouvons l’implication de droite à gauche. Soient p et qg deux états tels que (p = q et pour tout a € 
V,(p,a) TK Ô(g,a)). 
De la deuxième hypothèse on déduit : 
Pour tout a € V, pour toute chaine x € V* de longueur k, 6(8(p,a),x) € F équivaut à 6(8(g,a),x) € F. 
Cette dernière propriété se réécrit : 
Pour toute chaine x € V* de longueur k+ 1, ô(p,x) € F équivaut à Ô(g,x) € F. 
Puisque p =} q, il en résulte que p =4+1 q. 
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— Soit n le nombre d’états de l’automate À, montrons qu’il existe un entier K tel que k < n et =;==}}==. 


1. Il existe un entier k < n tel que =;==};1. 
En effet les partitions associées aux relations d’équivalences =; sont de plus en plus fines lorsque k aug- 
mente. Puisque toute partition comprend au plus n classes, il existe un entier k < n tel que les partitions 
associées aux relations =+# et =;11 sont égales, donc tel que ces relations sont égales. 


2. Si= =m——=m+] alors =m——= 
SUPPOSONS QUE =n—=m+]1. De cette hypothèse et de la propriété[A] il résulte immédiatement que pour tout 
k>m,ona=r;-=}. 
Puisque la suite des relations =} est une suite décroissante, stable à partir de l’indice m, il en résulte que : 
M Nken —k- 
Donc d’après la propriété[T] === 


Exemple 2.1 Minimisons l’automate déterministe À de vocabulaire {a,b}, dessiné ci-dessous : 


TR 


INA 
vos 


@ 10) 


a 


On remarque que l’état 4 est inaccessible. On le supprime et on obtient l’automate connecté B ci-dessous : 


A 


PES, 


a 


On calcule les relations =, associées à l’automate B. Les numéros de la première colonne du tableau ci-dessous, sont 
les indices des relations d'équivalence =4. 
D'après la propriété] les deux états p et q sont dans la même classe de la relation =4}1 si et seulement si 
— ils sont dans la même classe de la relation =y4 
— Ô(p,a) et Ü(q,a) sont dans la même classe de la relation =k 
— Ô(p,b) et Ü(q,b) sont dans la même classe de la relation =k 
Le tableau qui suit est une disposition de ce mode de calcul, dans lequel les classes sont désignées par des majuscules. 
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k classes 
01 2: 5 6 7 8 3 
À B 
a | À À À B A A 
b|'A B A A A B 
111 5 712 86 3 
A B C D 
a B B A|A A 
biC C A|D D 
211 51712 816 \3 
A B C DE 
aiC C|IB|B B|E]|A 
b'D DIAÏIE E|BI|IE 
3/1 51712 816 \3 


Puisque les partitions associées aux relations =32 et =3 sont identiques, la relation = est identique à =2. Nous pouvons 
maintenant construire l’automate m(B), qui est dessiné ci-dessous. 

Pour calculer la partition associée à =3, il est inutile de calculer les classes des états 5(7,a),8(7,b),8(6,a),Ô(6,b), 
Ô(3,a),0(3,b) puisque les états 7,6,3 sont seuls dans leurs classes. Mais on a fait figurer ce calcul dans la table 
ci-dessus, car cela fait apparaitre la fonction de transition de l’automate minimal dans les trois avant dernières lignes 


de ce tableau. 
OO 
(A) : (C) : X8).) a 


DE) b 


3 Unicité de l’automate minimal 
Définition 3.1 (Automate réduit) Un automate réduit est un automate dont les états sont deux à deux non équivalents. 


Nous avons vu au paragraphe [comment construire un automate connecté et réduit équivalent à un automate À : 
— on enlève de À ses états inacessibles, ce qui donne l’automate B 
— l’automate m(B) est un automate connecté et réduit équivalent à À 
Dans ce paragraphe, on montre, par deux preuves bien différentes, les résultats suivants 
— un automate est minimal si et seulement si il est connecté et réduit (voir théorème [3.1] 
Il en résulte que m(B) est un automate minimal équivalent à À. 
— l’automate minimal est unique, au nom près de ses états (voit théorème [3.7] 
Il en résulte que m(B) est l’automate minimal équivalent à À. 


3.1 Propriétés de la catégorie des automates 


Propriété 3.1 Si un automate est minimal, il est connecté et réduit 


Preuve : Supposons que l’automate À ne soit pas connecté ou pas réduit. Examinons ces deux cas. 


1. Supposons que À ne soit pas connecté. En enlevant ses états inacessibles, on obtient un automate équivalent avec 
moins d'états que À. Donc À n’est pas minimal. 
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2. Supposons que À ne soit pas réduit. L’automate m(A) est un automate équivalent avec moins d’états que À. Donc 
A n’est pas minimal. 


Définition 3.2 (homorphisme et isomorphisme d’automates) Soient À —< Q,V,d,i,F > et B=< R,V,n,j,G > 
deux automates. L'application h : Q + R est un homorphisme de A dans B lorsqu'elle vérifie 

— h(i)=J 

= h(F) = G où h(F) = {h(p) | p € F}. 

— pour tout p € Q,a € V, h(ë(p,a)) =n(A(p),a) 
Un homomorphisme bijectif est un isomorphisme. 
Deux automates sont isomorphes, s’il y a un isomorphisme de l’un dans l’autre. Informellement, ces deux automates 
sont identiques au nom près de leurs états. 


Lemme 3.1 Soient À —< Q,V,ô,i,F > etB—<R,V,n, j,G > deux automates équivalents et connectés. Si B est réduit 
alors il y a un homorphisme h de A dans B tel que h(Q) = R où h(Q) = {h(p) | p € O}. 


De ce lemme, il est facile de déduire la propriété «un automate est minimal si et seulement il est connecté et réduit» 
ainsi que l’unicité de l’automate minimal. 

Preuve : Soit h C Q x R la relation définie par À = {(ô(i,x),n(j,x)) | x € V*}. 

On montre que h est un homomorphisme de À dans B. 


1. Q est le domaine de la relation A. 
En effet soit p € Q. Puisque À est connecté, il existe une chaine x € V* telle que p — Ô(i,x). Donc p est dans le 
domaine de h. 


2. h est une fonction de Q dans R telle que pour tout x € V*, A((i,x)) = n(j,x). 
D'après la définition de la relation h et le fait, prouvé ci-dessus, que Q est le domaine de la relation h, il suffit de 
vérifier que : 
(a) pour toutes chaines x, y € V*, si Ô(i,x) = Ô(i,y) alors n(j,x) =N(j,y) 
Supposons au contraire qu’il y a deux chaines x, y € V* telles que : 
(b) 8(i,x) = 8(i,y) et n(j,x) À n(j,y) 
Puisque l’automate B est réduit, les deux états n( j,x) et n(j,y) ne sont pas équivalents, donc : 
(c) il existe z € V* tel que l’un des deux états n(n(j,x),z) et n(n(j,y),z) est dans G tandis que l’autre n’est pas 
dans G. 
Soit L le langage reconnu par les deux automates équivalents. Puisque G est l’ensemble des états finals de B, la 
propriété ci-dessus implique : 
(d) il existe z € V* tel que l’une des deux chaines xz et yz est dans L tandis que l’autre n’est pas dans L. 
Puisque ô(i,x) = Ô(i,y), alors pour toute chaine z € V*, ô(i,xz) = Ô(i,yz). Puisque l’automate À reconnait L, on 
en déduit : 
(e) pour toute chaine z € V*, les deux chaines xz et yz sont toutes les deux éléments L, ou toutes les deux non 
éléments Z. 
Les propositions (d) et (e) sont contradictoires, donc la proposition (b) est fausse et par suite la proposition (a) 
est vraie. 


3. h(Q)=R. 
Puisque h est une application de Q dans R, il suffit de vérifier que tout élément de R est l’image par À d’un 
élément de Q. 
En effet soit p € R. Puisque B est connecté, il existe x € V* tel que p = n(j,x). D’après la propriété ci-dessus] 
p = h(ô(i,x)). Donc p € h(Q). 

Maintenant que l’on sait que h est une fonction de Q dans R telle que 
1. pour tout x E V*, A((i,x)) = n(j,x). 
2. h(Q) = R. 


il reste à démontrer que h est un homorphisme de À dans B. 
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1. A(i) = j. 
D’après la propriété rappelée ci-dessus[1] h(ô(i,e)) = n(j,€). Par définition des extensions des fonctions 6 et n, 
Ô(i,E) —ietn(j,€) = j. Donc h(i) — j. 
2. h(F)=G. 
On prouve que h(F) C G, puis que GC A(F). 
(a) A(F)CG. 
Soit p € F. Puisque À est connecté, il existe x € V* tel que p = Ô(i,x). 
Puisque p € F, la chaine x est dans le langage reconnu par A. 
D’après la propriété [1] h(p) =N(j,x). Puisque les automates À et B sont équivalents, x est aussi reconnu 
par B, donc n(j,x) € G et par suite A(p) € G. 
(b) GCA(F). 
Soit p € G. Puisque B est connecté, il existe x € V* tel que p =n(j,x). 
Puisque p € G, la chaine x est dans le langage reconnu par B. 
D’après la propriété [1] p = h(ë(i,x)). Puisque les automates À et B sont équivalents, x est aussi reconnu 
par À, donc ô(i,x) € F et par suite pE h(F) 
3. Pour tout p € Q,a € V, h(ë(p,a)) =n(h(p),a). 
Soit p € Q et a € V. Puisque À est connecté, il existe x € V* tel que p = ÔÜ(i, x). 
D’après les propriétés des automates déterministes, h(ô(p,a)) = h((i,xa)). 
D’après la propriété|1] h((i,xa)) = n(j,xa). 
D’après les propriétés des automates déterministes,n( j,xa) —=n{n(j,x),a). 
D’après la propriété [1] nin(,x),a) = n(A(ô(i,x)),a). 
Puisque p = Ô(i,x), on a bien A(d(p,a)) =n(A(p),a). 


Théorème 3.1 (Propriété caractéristique de l’automate minimal) Un automate est minimal si et seulement si il est 
connecté et réduit. 


Preuve : L’implication de gauche à droite est déjà prouvée par la propriété [3.1] 
Réciproquement, soit À —< Q,V, à,i,F > un automate connecté et réduit. Montrons qu’il est minimal, c’est-à-dire que 
tout autre automate équivalent a au moins autant d’états. 

Soit B—=< R,V,n,/j,G > un automate quelconque équivalent à À et soit C =< S,V,6, j,H > l’automate obtenu en 
enlevant les états inaccessibles de À. 

L’automate C est équivalent à À et connecté. 

D’après le lemme3.1] il y a un homorphisme h de C dans À tel que A(S) — Q. Par suite : 
nombre d’états de C > nombre d'états de A. 

Puisque C est obtenu en enlevant les états inaccessibles de B : 

nombre d’états de B > nombre d’états de C. 

Donc tout automate équivalent à À possède au moins autant d’états que À : À est minimal. 


Théorème 3.2 (Unicité de l’automate minimal) Si deux automates sont équivalents et minimaux, ils sont isomor- 
phes 


Preuve : Soient À —< Q,V,ô,i,F > et B—<R,V,n,j,G > deux automates équivalents et minimaux. 

Puisqu’ils sont minimaux, d’après le théorème [3.1] ils sont connectés et réduits. 

Donc, d’après le lemmef3.1| il y a un homomorphisme h de À dans B tel que h(Q) = R. 

Puisque les deux automates sont minimaux, les ensembles Q et R ont le même nombre d’éléments et puisque A(Q) =R, 
la fonction h est bijective. Donc À et B sont isomorphes. 


4 Automate minimal et théorème de Myhill-Nérode 


Ce paragraphe est dédié à une preuve alternative du résultat déjà prouvé suivant : 
Soit À un automate connecté. L’automate m(A), défini en est l'unique automate minimal équivalent à A. 
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Définition 4.1 (Dérivé et Équivalence entre chaînes) Soit L un langage sur le vocabulaire V. 
1. Soit u € V*. Soit u-\L= {ve V* | uv € L}. Ce langage est la dérivée de u relativement à L. 
2. Deux chaînes u et v, où u,v € V*, sont équivalentes relativement à L si et seulement elles ont la même dérivée 
relativement à L. On note =Y cette relation d'équivalence entre chaînes. L'indice L peut être omis quand il n’y 
a pas d’ambiguité. 
Propriété 4.1 (Propriété de l’équivalence entre chaînes) Soit L'un langage sur le vocabulaire V. Soient u,v € V* 
1. u =} v si et seulement si pour toute chaîne x € V*, ux € L si et seulement si vx € L. 


2. siu = v alors pour toute chaîne x € V*, ux =z vx 
La preuve est immédiate, comme pourra le vérifier le lecteur. 


Définition 4.2 (Automate des classes d’un langage) Soit L'un langage sur le vocabulaire V. Soit A(L) =< Q,V,ô,i,F > 
l’automate déterministe suivant[]: 


1. Q est l’ensemble des classes de la relation =r 
2. Pour tout x € V*,a € V, ô([x]=, ,a) = [xa]=, 
3. i= [€] 


4. Fest l’ensemble des classes des chaînes du langage L 


=L 


A(L) est l’automate des classes du langage L. 


Notons que l’application à est bien définie, car d’après la propriété [1] pour tout x,y € V*,a € V, si x =g y alors 
XA =L ya. 


Propriété 4.2 Soit A(L) l’automate des classes du langage L. On reprend les notations ci-dessus. 


1. Pour tous x,y € V*, ô([x]=, ,y) = (xy]=, 
2. L'automate A(L) reconnait L. 


Preuve : On reprend les notations ci-dessus. 
1. On prouve la première partie de la propriété par une induction immédiate sur y 


2. Montrons la deuxième propriété : 
x est reconnu par A(L) 


si et seulement si ô([e]=, ,x) € F 
si et seulement si [x]=, € F d’après la première partie de la propriété 
si et seulement si x € L car F est l’ensemble des classes des chaînes du langage L 


Théorème 4.1 (Théorème de Myhill-Nérode) Le langage L est régulier si et seulement si le nombre de classes de 
=L est fini. 


Preuve : 


1. Supposons L régulier. Montrons que le nombre de classes de =7 est fini. 
Puisque L est régulier, il y a un automate déterministe fini À —< Q,V, à,i,F > qui reconnait L. 
Soit À l'application suivante : 
— son domaine est l’ensemble des classes d'équivalence de la relation =7, définie en 
— sa portée est l’ensemble des classes d’équivalence de la relation =1, définie mn 
— Pour tout x e V*, h([x]=,) = [ô(i,x)]=, 


Île nombre des états de l’automate n’est pas nécessairement fini 
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(a) Montrons que x = y si et seulement si Ô(i,x) =4 Ô(i, y). 


En effet 
x =, y si et seulement si (pour tout z € V*, xz € L si et seulement si yz € L) D’après la propriété [4.1] 
si et seulement si (pour tout z € V*,Ü(i,xz) € F si et seulement si ô(i,yz) € F Car l’automate À reconnait L 


si et seulement si (pour tout z € V*,6(8(i,x),z) € F si et seulement si Ô(Ô(i,y),z) € F) D’après chapitre 


si et seulement si Ô(i,x) =4 Ô(i,y) Par définition de =4 
(b) h est une application entre classes. 
En effet d’après la propriété|Tal si x =7 y alors Ô(i,x) =4 Ô(i, y). 
(c) h est injective. 
Supposons [ô(i,x)]=, = [8(i,y)]=,. D’après la propriété|Tal x =z y, donc [x]=, = [y]=,. 
Puisque h est une injection, le nombre de classes de =, est au plus égal au nombre de classes de =4. 
Il est trivial que le nombre de classes de =4 est au plus égal au nombre d’états de A. 
Puisque À est un automate fini, le nombre de classes de = est donc fini. 
2. Supposons que le nombre de classes de =, est fini. 
L’automate A(L), défini en est alors un automate déterministe fini, qui, d’après la propriété[H.2] reconnait Z, 
par suite L est un langage régulier. 


Nous redémontrons, par une autre méthode, l’unicité de l’automate minimal, déjà prouvé par le théorème [3.2] 


Théorème 4.2 (L’automate minimal est unique) Soit L un langage régulier sur le vocabulaire V. L'automate A(L) 
des classes de L est minimal et tout automate minimal équivalent lui est isomorphe. 


Preuve : 


1. A(L) est minimal. 
Soit À un automate quelconque reconnaissant L. Comme nous l’avons vu dans la démonstration du théorème de 
Myhill-Nérode, le nombre d’états de A(L) est au plus égal à celui de À, donc A(L) est minimal. 


2. Tout automate minimal reconnaissant L est isomorphe à A(L). 
Soit À —< Q,V,ô,i,F > un automate minimal reconnaissant L et soit A(L) =< R,V,n,j,G >. 
D’après la démonstration du théorème de Myhill-Nérode, le nombre d’états de A(L) est au plus égal à celui des 
classes de =1, et trivialement le nombre de classes de =4 est au plus égal au nombre d’états de À. 
Puisque À est minimal, le nombre d’états de A(L), le nombre de classes de =4 et le nombre d’états de À sont 
égaux. Par suite il n’y a qu’un état par classes de =41, autrement dit À est réduit. 
L’automate À est aussi connecté, car s’il ne l’était pas, 1l serait équivalent à l’automate obtenu en lui enlevant 
ses états inaccessibles, donc À ne serait pas minimal. 
Soit A l'application, définie dans la preuve du théorème de Mihill-Nérode, par : 
Pour toute chaîne x € V*, A([x]=,) = [ô(i,x)]=, . 
D’après cette preuve, h est une injection entre les états de A(L) et les classes de =1. Puisque le nombre des états 
de A(L) et le nombre des classes de classes de =14 sont égaux, h est une bijection. 
Soit h! l'application entre les états de A(L) et ceux de À définie par : 
Pour toute chaîne x € V*, k/([x]=,) = Ô(i,x) 
Puisque h est une bijection et qu’il n’y a qu’un état par classe de =1, h/ est aussi une bijection. Montrons que 
c’est un isomorphisme entre A(L) et À. Il suffit de vérifier que c’est un homorphisme (voir la définition [3.2}. 
(a) H(j)=i. 
En effet, par définition de A(L), j = [e]=,. 
Par définition de h/, h'([e]=,) — ô(i,e). 
Par définition de l’extension de 6, ô(i,€) — i. Par suite h/(j) — i. 
(b) Pour tout x € V*,a € V, h'(n([x]=, ,a)) = 8(h'([x]=, ,a). 
h'(n((x]=,,a)) =h'([xal=,) D’après la Prop 
h'([xa]=,) = Ô(i,xa) Par définition de h’ 
Ô(i,xa) = O(Ô(i,x), a) Par la propriété|S.3|du chapitre IV] 
S(O(i,x),a) — G(h'([x]=,),a) Par définition de 
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(©) h(G)=F. 

i M(G)CF 
Soit p un état de G. Il existe x € L tel que p = [x]=,. 
Par définition de h’, h'(p) = h'([x]=,) = ô(i,x). 
Puisque x € Let que À reconnait L, ô(i,x) € F, donc h'(p) € F. 

ü. FCh(G) 
Soit p € F. Puisque À est connecté, il existe x tel que Ô(i,x) = p. 
Puisque p est un état final de l’automate À reconnaissant L, x € L. 
Par définition de h”, p = h'({[x]=, ). Puisque x € L, [x]=, est un état final de A(L), donc p € h'(G). 


Nous justifions, par une autre méthode, la construction de l’automate minimal fournie au paragraphe[f] 
Théorème 4.3 Si À est un automate connecté, alors m(A) est l’automate minimal équivalent à A. 


Preuve : Soit À un automate connecté et L le langage reconnu par À. Soit m(A) —=< Q,V,ô,i,F >. On sait que m(A) 
est réduit et connecté. On en déduit que m(A) est isomorphe à A(L). 

Soit À l’application entre les états de A(L) et les classes de la relation =»(4) définie par : 

Pour tout x € V*, h([x]=,) = [8(i,x)]=,,,,. 

D’après la preuve du théorème de Mihill-Nérode, h est une injection. Puisque m(A) est connecté, on vérifie facilement 
que c’est une bijection. 

Soit h’ l’application entre les états de A(L) et les états de m(A) définie par : 

Pour tout x € V*, h([x]=,) = ô(i,x). 

Puisque h est une bijection et que m(A) est réduit (autrement il n’y a qu’un état par classe de =,,(4)), l'application h 
est aussi une bijection entre les états de A(L) et ceux de m(A). 

Puisque A(L) est minimal, m(A) est aussi minimal. 


Exercice 4.1 Soit L un langage sur le vocabulaire V et soit À —< Q,V, à,i,F > l’automate suivant : 

— Les états de À sont les dérivées relativement à L 

— Pour tous u € V*,a € V, ô(u !L,a) = (ua) !L 

— L'état initial est L 

— Un état est final si et seulement si il est la dérivée d’une chaîne de L 
L'automate A est l’automate des dérivées de L. Montrez que cet automate reconnait L et qu'il a le même nombre 
d'états que l’automate A(L) des classes de L 
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Chapitre VII 


Définition de langages par induction 


Il est naturel de définir des langages par des définitions inductives, prenant la forme de systèmes d’équations. Les 
langages définis par des systèmes d’équations sont appelés des langages algébriques et dans ce chapitre 
— on montre qu’un langage est algébrique si et seulement si il est hors-contexte 
— on étudie les transformations des systèmes d’équations qui en préservent l’ensemble des solutions 
— on donne une condition nécessaire et suffisante, calculable pour qu’un système d’équation ait une et une seule 
solution. 


1 Exemples de définitions inductives de langages 


Nous utilisons ci-dessous, sauf exception, les notations des expressions régulières. 


1. X = {a"b" | n > 0} est solution de l’équation X — £+aXb. C’est aussi la plus petite solution de cette équation. 
En effet, puisque {£} C X, € est dans toute solution, et si a”b" est dans une solution, puisque aXb C X, atlpr+i 
est aussi dans cette solution. 

Donc, par induction sur n, iv{a"b" | n > 0} est un sous-ensemble de toute solution. 

Cette équation n’a d’ailleurs qu’une solution. Supposons au contraire qu’il y a un plus petit mot x dans une 
solution L, avec x g {a"b"|n > 0}. 

Puisque x est un mot de la solution Z, il s’écrit ayb avec y € Let y € {a"b" | n > 0}, ce qui contredit le fait que 
x est le plus petit mot avec cette propriété. 

Notons que le langage {a"b" | n > 0} est engendré par la grammaire X — e|aXb : le signe égal de l’équation 
devient une flêche et le plus devient une barre. 


2. X = {aPb1cPT4 | p > 0,q > 0} est solution de l’équation X = {b4c4 | q > 0} +aXc. C’est aussi la plus petite. 
En effet, puisque {b4c1 | q > 0} C X, {b4c1 | q > 0} est dans toute solution, et si a” bc? 4 est dans une solution, 
puisque aXc C X, aP+1bicP+4+l est aussi dans cette solution. 

Donc, par induction sur p, {aPb1cP*4 | p > 0,q > O0} est un sous-ensemble de toute solution. 

Puisque ci-dessus, on a vu que {b"c" | n > 0} est la plus petite solution de Y = e+bYc, il en résulte que 
{aPbic | p+q = r} est la valeur de X de la plus petite solution du système : 

X =Y+aXc 

Y=e+bYc 

Comme ci-dessus, on peut vérifier que cette solution est unique. 

Notons que le langage {a?b{c?*4 | p > 0,q > 0} est engendré par le non-terminal X de la grammaire 

X —YlaXc 

Y — elbYc 

Comme ci-dessus, le signe égal des équations devient une flêche et le plus devient une barre. 


3. On définit les expressions dont les opérandes sont a et b et les opérateurs + et *. 
Toute expression est un terme, ou bien s’écrit e +f où e est une expression et f est un terme. 
Tout terme est un facteur, ou bien s’écrit f x f où f est un terme et f est un facteur. 
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Un facteur est de la forme a, b ou (e) où e est une expression. 
D'après la définition ci-dessus, l’ensemble des expressions, termes et facteurs est la plus petite solution respec- 
tivement en E, T et F du système d’équations : 


E=T+E+T 
T=F+TxF 
F=a+b+(E) 


Notons que le signe + des expressions est souligné pour le distinguer du plus des expressions régulières. 
Comme dans les cas ci-dessus, la solution est unique. 


2 Théorèmes du point fixe 


Toute définition inductive peut être vue comme la solution d’une équation x = f(x) où f:E + E, autrement dit 
comme un point fixe de la fonction f. Aussi on étudie les conditions d’existence et de construction de points fixes. 


2.1 Ordre faiblement complet 


Définition 2.1 (ordre faiblement complet) Soir E un ensemble ordonné. 

Une suite dénombrable sur cet ensemble, est une suite u; d'éléments de E où i € N. 

Une relation d’ordre sur un ensemble E est dite faiblement complète si foute suite croissante dénombrable a une borne 
supérieure. Un ensemble ordonné est faiblement complet, si sa relation d'ordre est faiblement complète. 


Lorqu’elle existe, la borne supérieure de l’ensemble X est notée sup(X). 
Lorsqu'elle existe, la borne inférieure de l’ensemble X est notée inf(X). 


Définition 2.2 (fonction continue) Soient E et F deux ensembles faiblement complets. La fonction f : E + F est 
continue, si pour toute suite u; croissante dénombrable d'éléments de E, f(sup{ui|ie N}) = sup{f(ui) |ieN} 


Propriété 2.1 Toute fonction continue est croissante 


Preuve : Soient E et F deux ensembles faiblement complets et f : E  F une fonction continue. Soient a, b € E avec 
a < b. Soit u; la suite dénombrable où wo = a et pour i € N, u;41 = b. 
Puisque a < b, sup{ui | i € N} = b, donc par continuité f(b) = sup{f(a), f(b)}, autrement dit f(a) < f(b). 


Théorème 2.1 (Théorème de Kleene) Soit E un ensemble faiblement complet ayant un plus petit élément noté L. 
Soit f une fonction continue de E dans lui-même. Le plus petit point fixe de f est sup{f'(1)|ieN}. 


Preuve : 


1. La suite f'(L) où i € N est croissante et donc, sup{ f'(L) |i € N} est bien définie. 
Montrons, par induction sur à, que pour tout i € N, f'(L) < fi#1(L). 
Puisque L est le plus petit élément de E, 1 < f(_L), ce qui rend vraie la propriété pour i — 0. 
Supposons f'(L) < fT1(L). Puisque f est continue, elle est croissante donc, en appliquant f aux deux membres 
de l'inégalité ci-dessus, f+1(1) < fF2(1). 
Puisque E est faiblement complet et que la suite f'(_L) est croissante, sup{ f'(L) | i € N} existe. 
2. sup{ fi(L) | ie N} est un point fixe de f. 
Puisque _L est le plus petit élément de E, on a : 
(a) sup{f(L) lIEN} = sup{f"(L)|ieN}. 
Par continuité, f(sup{f'(1)|ieN}) = sup{ft(1)|ieN}. 
D’après l’égalité (a), f(sup{ f'(L) | ie N}) = sup{fi(L) |ie N}. 
3. sup{f'(1) | ie N} est le plus petit des points fixes de f. 
Soit a un point fixe de f. Il suffit de montrer que pour tout i € N, f'(L) < a. 
Pour i — 0, cette inégalité est vraie, car L est le plus petit élément de E. 
Supposons f'(_L) < a. Puisque f est croissante, fil (1) < f(a). Puisque a est un point fixe, f'+1(1) < a. 
Donc par induction, pour tout i € N, f'(L) < a, et par suite sup{fi(1)|ieN}<a 
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2.2 Ordre complet 


Définition 2.3 (ordre complet, treillis complet) Soit E un ensemble ordonné. 

Une relation d'ordre sur un ensemble E est dite complète si tout sous-ensemble de E a une borne supérieure dans E. 
Un ensemble ordonné est complet, si sa relation d'ordre est complète. 

Un ensemble ordonné complet est aussi appelé un treillis complet. 


De la définition d’un treillis complet E, il résulte que E a un plus grand élément sup(E) et un plus petit élément sup(0). 


Exemple 2.1 


1. Soit E un ensemble. L'ensemble P(E),aussi noté 2Ë, ordonné par C est un treillis complet. En effet soit X un 
sous-ensemble de P(E), la borne supérieure de X est l’ensemble [JX. 


2. Soient X et E deux ensembles. Soit P(E)* l’ensemble des applications X dans P(E). On ordonne cet ensemble 
par l'extension de l’ordre des sous-ensembles de E aux fonctions : 
Soient f,g € P(E)*, f C g si et seulement pour tout x € X, f(x) C g(x). 
Soit Y un sous-ensemble de P(E)*, la borne supérieure de Y est aussi notée |JY et elle est définie par : 
pour tout x € X, (UY)(x) =U{f(x) | f € Y}. Par suite P(E)*, muni de l’ordre défini ci-dessus, est un treillis 
complet. 


Propriété 2.2 Tout sous-ensemble d’un treillis complet a une borne inférieure. 


Preuve : Soit E un treillis complet et X C E. Soit M l’ensemble des minorants de X. 

Puisque E est complet, la borne supérieure de M existe. Soit m cette borne. 

Tout élément de X est un majorant de M, donc m, étant le plus petit des majorants de M, est un minorant de X. Donc 
m € M. Puisque m est la borne supérieure de M, m est aussi le plus grand élément de M, donc la borne inférieure de 
X. 


Définition 2.4 (treillis) Soit E un ensemble ordonné. 
E est un treillis si et seulement si tout sous-ensemble avec deux éléments a une borne supérieure et une borne in- 
Jérieure. 


Propriété 2.3 Soit E un ensemble ordonné. 
E est un treillis si et seulement si tout sous-ensemble fini non vide a une borne supérieure et une borne inférieure. 


La preuve est évidente par induction sur le nombre d’éléments des sous-ensembles finis non vides. 


Remarque 2.1 Puisque tout sous-ensemble d’un treillis complet possède une borne supérieure et une borne inférieure, 
un treillis complet est bien un treillis. 


Théorème 2.2 (Théorème de Tarski) Soit E un treillis complet ordonné par <. Soit f : E — E une fonction crois- 
sante. Alors inf{c € E | f(c) < c} est le plus petit point fixe de f. 


Preuve : SoitC={ceEl]f(c) <c}et p=inf(C). 

1. L'ensemble C n’est pas vide. En effet, s’il l’était, on aurait f(c) > c pour tout c € E. Donc en particulier, comme 
sup(E) € E, on devrait avoir f(sup(E)) > sup(E), ce qui est impossible. 

2. Montrons que f(p) < p. 
Soit c € C. Puisque p = inf(C), p < c. Puisque f est croissante f(p) < f(c). Puisque c EC, f(c) < c. Par suite 
f(p)< c. 
L'élément f(p) est donc un minorant de C, puisque p est le plus grand de ces minorants, f(p) < p. 

3. Montrons que p est le plus petit point fixe de f. 
Puisque f(p) < p et que f est croissante, f(f(p)) < f(p). Donc f(p) € C et puisque p est la borne inférieure 
de C, P < f(p). 
Donc p = f(p). Puisque tous les points fixes de f sont éléments de C, et que p est la borne inférieure de C, ilen 
résulte que p est le plus petit point fixe de f. 
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2.3 Treillis finis 


1. Un treillis fini, ayant un plus petit élément, est complet. 
En effet soit E un treillis fini, autrement dit Æ est fini, ayant un plus petit élément L. Tout sous-ensemble non 
vide de E étant fini, il a une borne supérieure. De même sup(0) — 1. Donc tout sous-ensemble de E a une borne 
supérieure. 

2. Dans un treillis fini, une fonction croissante est continue. 
En effet soit E un treillis fini et f : E + E une fonction croissante. Soit u; une suite croissante dénombrable 
d’éléments de E. Puisque E est fini, il existe un plus petit entier j qui est le plus grand élément de la suite, la 
suite devenant stationnaire à partir de cet indice. Donc sup{u; | i EN} = u;. 
Puisque f est croissante, la suite f(u;) est aussi croissante et stationnaire à partir de l’indice j. 
Donc sup{f(ui) | ie N} = f(u;). 
Par suite f(sup{u; | i € N}) = sup{ f{u;) | i € N}, autrement dit f est continue. 

3. Calcul du plus petit point fixe d’une fonction croissante dans un treillis fini, ayant un plus petit élément. 
Soit E un treillis fini, ayant un plus petit élément 1. Soit f : E - E une fonction croissante. 
Puisque f est continue, d’après le théorème de KiceneP] le plus petit point fixe de f est sup{ f'(L) | ie N}. 
Dans la preuve de ce théorème, il est montré que la suite f'(_L) est croissante. 
Soit n le nombre d’éléments de E. Puisque la suite f'(_L) est croissante, il existe un plus petit indice j où j <n 
tel que f/(L) = fi+I(1). 
Une induction triviale montre que pour tout k tel que k > j, on a f/(L) — f'(L). Doncf/(_L) est le plus petit 
point fixe de f. Aussi, pour calculer ce plus petit point fixe, il suffit de calculer la suite f'(_L) jusqu’au premier 
indice j < n tel que f/(1) = fi1(1). 


3 Langages algébriques 


Définition 3.1 (Système d’équations) Soient Vr et Vy deux vocabulaires disjoints et V l'union de ces deux vocabu- 
laires. Vr est l’ensemble des terminaux et Vy est l’ensemble des non terminaux. Un non terminal est aussi appelé une 
variable. 

Un système d'équations sur Vr et Vy est un triplet < Vr,Vy,d > où d est une application de V\ dans l’ensemble des 
parties finies de P(V*). 

Soit S un tel système d'équations, il est présenté sous la forme : pour toute variable A, A — d(A). 

L'ensemble fini de mots d(A) est la définition de A. Il est écrit comme la somme de ses mots. 


Voici comment se présente un système d’équations avec deux terminaux a, b et deux variables Ao,A:1 : 
Ao = aAo+bA: 
A, = aAjb+e 


Définition 3.2 (Interprétation) Soient Vr et Vy deux vocabulaires disjoints et V l’union de ces deux vocabulaires. 
Une interprétation de Vn sur Vr est une application 1 de Vy dans l’ensemble des parties de P(V*) ; on note I(A) 
l’image de la variable À € VW. 
Soit I une telle interprétation. Elle est étendue aux mots et langages sur V de la façon suivante : 

— I(e) — {e} 

— Si a € Vr, alors I(a) = {a} 

— Six,y € V*, alors I(xy) = I(x)I(y) 

— Si L est un langage sur V, alors I(L) = U{I(x) | x € L} 


Exemple 3.1 Soient a,b deux terminaux et A6, A1 deux variables. 
Soit I l'interprétation suivante : (A0) = {a"b" | n > 0} et I(A;) = {b" |n > 0}. 
Par définition des extensions de 1, on a : I(bAo + aA;) = {ba"b" | n > 0}U{ab" |n > 0}. 


Remarque 3.1 L'interprétation 1 de l’ensemble V\ de variables est l’ensemble de couples {(A,I(A)) | À € Vw}. Ces 
couples sont souvent notés À = I(A). 
C’est ainsi que l'interprétation 1 ci-dessus est aussi notée : Ag = {a"b"|n > 0},A; = {b"|n >0} 
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Définition 3.3 (Solution d’un système d’équations) Soit S —< Vr,Vy,d > un système d'équations. 
L'interprétation 1: Vn + P(V) est une solution de S si et seulement si pour tout À € Vy, I(A) = I(d(A)). 


Exemple 3.2 Soit le système, avec deux terminaux a, b et deux variables Ao,A1, déjà présenté ci-dessus : 

A0 = aAp+bA; 

A, = aAjb+e 
L'interprétation Ao = {a"ba?b? | n,p > 0},A; = {a"b" | n > 0} est solution de S. C'est d'ailleurs l'unique solution de 
ce système. 


Définition 3.4 (Fonction définie par un système d’équations) Soit S —< Vr,Vy,d > un système d'équations. 
La fonction définie par S, notée fs, est une fonction de l’ensemble P(VH)N des interprétations dans lui-même, définie 
pour toute interprétation 1 par : pour tout À € Vn, fs(1)(A) = I(d(A)). 


D’après les deux dernières définitions, I est solution de S si et seulement si I est un point fixe de fs. 
On rappelle que, dans ce même exemple, si E est un ensemble d’interprétations, alors l’interprétation (JE) est définie 
par : 


pour tout À € Vy,(UE)(A) =U{I(A)|IEE}. 
D’après l’exempleP.I] l’ensemble P(VS)Y des interprétations ordonné par l’extension suivante de € : 
Soient I,J deux interprétations, I C J si et seulement si pour tout À € Vy,I(A) C J(A), 


est un treillis complet. Nous nous servirons de cet ordre par la suite. 

Nous allons montrer que fs est une fonction continue, ce qui nous permettra d’utiliser le théorème de Kleene pour 
caractériser la plus petite solution du système S. 
Avant de faire cette preuve, nous avons besoin de quelques propriétés de suites croissantes d’interprétations. 


Propriété 3.1 (Suite croissante d’interprétations et concaténation) Soient Vr et Vn deux vocabulaires disjoints et 
V l’union de ces deux vocabulaires. Soit E un ensemble totalement ordonné d’interprétations de V\ sur Vr, autrement 
dit un sous-ensemble totalement ordonné de P(VF)"\, avec pour ordre l'extension de C définie ci-dessus. 


Pour tous x,y € V*, U{GI() [LE E} = (U{IQ) LE EP(UUG) |1EE}) 


Preuve : 


1. SoitzEe U{I(x)I(y) [I1EE}. 
Montrons que z € (U{I(x) [IE Eh (U{I() [1e E}. 
D’après l’hypothèse, il existe une interprétation I € E telle que z € I(x)I(y). 
Donc z=uvoèuel(x) etvelI(y). 
Donc u EUJ{I(x)|1EE}etv EU{I() |IEE}. 
Par suite z € (U{I(x) [IE E})(U{IG) |1EE}). 
2. Soitze (U{I(x) [IE Eh (U{I(y)|1E E}). 
D’après l’hypothèse, z = uv avec u E [J{I(x) [Ie EtetveUJ{IG) [I1EE}. 
Donc il existe I € E telle que u EI(x)etJ € E telle que v € J(y). Puisque E est totalement ordonné, T et J sont 
comparables : soit K la plus grande de ces deux interprétations. 
On a u E K(x) et v E K(y), Puisque z = uv, il en résulte que z € K(x)K(y) et par suite z E U{I(X)I(y) | IE E}. 


Propriété 3.2 (Suite croissante d’interprétations et mots) Soient Vr et Vy deux vocabulaires disjoints et V l'union 
de ces deux vocabulaires. Soit E un ensemble totalement ordonné d’interprétations de Vy sur Vr. 
Pour tout x E V*, U{I(x) |1EE} = (UE)(x) 
Preuve : On prouve la propriété par induction sur la longueur de x. 
1. Six = €, alors I(x) = {£}. Par suite [J{I(x) [IE E} = {£} = (UE)(x) 
2. Six € Vr, alors I(x) = {x}. Par suite [J{I(x) [IE E} = {x} = (UE)(x) 
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3. Soit x € Vy. D’après la définition de [JE rappelée ci-dessus après la définition [3.4] on a: [UJ{I(xX)|IEE} = 
(UE) (x) 

4. Soit x € V* de longueur supérieure à 1. 
Supposons que pour tout mot # de longueur inférieure à x, on ait : [J{I(u) [IE E} = (UE)(u) 
Puisque la longueur de x est supérieure à 1, il existe y,z deux chaînes non vides telles que x = yz. On a alors : 


U{IG)IIEE} = U{Gz)|IEE} Car x = yz 
= U{O)I(G)ÎTEE} car I(yz) = 1(y)I() 
= (U{IG)|IEE}(U{I(G)|IEE}) d’après la propriété[3.T|(car E est totalement ordonné) 
= (UE)()(UE)(:) par l'hypothèse d’induction appliquée à y et z 
— (UE)(y2) car [JE est une interprétation 
= (UE)(x car x = yz 


Propriété 3.3 (Suite croissante d’interprétations et langages) Soient Vr et Vy deux vocabulaires disjoints et V l’u- 
nion de ces deux vocabulaires. Soit E un ensemble totalement ordonné d’interprétations de VN sur Vr. 
Pour tout L langage sur V, U{I(L) |1E E} = (UE)(L) 


Preuve : En effet 
xEUX{IL)IIEE} 
si et seulement si il existe I € E telle que x E I(L) par définition de (J 
si et seulement siilexiste IE E, il existe y € LtelsquexelI(y) carI(L) =U{I(y)|y € L} 
si et seulement si il existe y € L, ilexiste 1€ E tels quex € I(y) en permutant les "il existe" 


si et seulement si il existe y € L, x EUJ{I(Y)|IEE} par définition de [J 
si et seulement si il existe y € L, x € (UE)(y) d’après la propriété 
si et seulement si x € (UE)(L) car (UE)(L) = U{(UEË)(») |» € L} 


Propriété 3.4 Soient X et Y deux ensembles et f une fonction de l’ensemble Y* dans lui même. Soient Z € Y* et 
xeX. 


Alors {(f())() | y eZ} = {8(x) | 8 € {fG) | y eZ}; 


Preuve : En effet : 


u € {(FO))Q) |» eZ} 

si et seulement si il existe y € Z tel que u = (f(y))(x) 

si et seulement si il existe y € Z et il existe g € Y* tels que u = g(x) et g = f(y) D’après les propriétés de l’égalité 
si et seulement si il existe g € Y* tel que u = g(x) et il existe y € Z tel que g — f(y) En permutant les quantificateurs 
si et seulement si il existe g € Y* tel queu = g(x) etg € {f(y)|y € Z} 

si et seulement si il existe u € {g(x)|gE {f(O)|yEZ}} 


Théorème 3.1 La fonction fs définie par un système d'équations S est continue. 


Preuve : Soit S —< Vr,Vw,d > un système d’équations. 
On montre que : 


Pour tout E ensemble totalement ordonné d’interprétations de Vy sur Vr, fs(UE) =U{fsDIIEE} 


Puisqu’une suite croissante dénombrable est un cas particulier d’ensemble totalement ordonné, d’après la définition 

de la continuité [2.2] la propriété encadrée implique la continuité de fs. 

Pour montrer cette propriété, il suffit de vérifier que pour tout À € Wy, fs(UE)(A) = (U{(fs(1))|1EE})(A). 

En effet : 
(fs(UE))(A) (UE)(d(A)) D’après la définition[3.4lde fs 

U{I(d(A))|IEE} D’après la propriété|3.3|appliquée au langage d(A) 

= U{(fsD)(A)IIEE} D’après la définition3.Alde fs 
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Or, d’après la propriété[5.4] {(sSD)A)IIEE} = {(A)|TE{fS(DIIEE})}. 
On en déduit que [J{(fs(D)(A)IIE E} =U{I(A)|IE {SD IIEE}}, d'où 


Js(UE)(A) = U{GA)|TE{SDIIEE}) 
= (U{fs(DIIEE})) (À) Car pour tout ensemble F d’interprétations, [J{J(A) |J € F}=(UF)(A) 


Théorème 3.2 Soit S un système d'équations sur l’ensemble Vr de terminaux et l’ensemble Vy de variables. 
Soit L la plus petite interprétation de Vn sur Vr : pour tout À € Vy, L(A) — 0. 
La plus petite solution de S est U{fi(L) | i € N}. 


Preuve : D’après le théorème ci-dessus [3.1] la fonction fs est continue. La plus petite solution de S est le plus petit 
point fixe de fs. D’après le théorème de Kleene, cette plus petite solution est U{f$(L) | i € N}. 


Exemple 3.3 
1. Soit S le système de terminaux a, b, de variable A5 et d’équation Ao = aAob + €. Alors : 
fs (1) = <Aor{e}> 
(il) =  <Apt {E,ab} > 
a (1) =  <Apt {£,ab,aabb} > 


f(L) <Aot= {aibi | j <i} 
ÜUS(LD)IIENY = <Aor {ab |jeN} 
La dernière fonction est la plus petite solution (d’ailleurs unique) du système d'équations. 


2. Soit S, le système d'équations avec deux terminaux a,b, deux variables A, A1 et les équations : 


A0 = aAo+bA: 
Aj = aAjb+Ee 
On a alors : 
dCi) = <Ao0A1r{e}> 
f(L) = <Ao{b},Air {e,ab}> 
(Li) =  <Aot {ab,b,bab},A;it {e,ab,aabb} > 
si =  <Apt {aab,ab,abab,b,bab,baabb}, A; -— {e,ab,aabb} > 
PC) = <Aor {albabf|j+k<i-1} Air {abi] j <i> 


U{ACDIIENY = <Aor {afbatbt| j,kEN}, A1 {aibi | jeN} > 


La dernière fonction est la plus petite solution (d’ailleurs unique) du système d'équations. 


4 Équivalence entre langages algébriques et hors-contextes 


Définition 4.1 Un langage est algébrique si et seulement il est une composante de la plus petite solution d’un système 
d'équations. Plus formellement soit L un langage sur Vr. Ce langage est algébrique si et seulement si il y a un ensemble 
de variables Vy, disjoint de Vr, un système d'équations S sur Vr et Vy, de plus petite solution 1, et une variable A € Vy 
telle que L = I(À). 


Le théorème suivant montre qu’un langage est algébrique si et seulement si il est hors-contexte. 


Définition 4.2 Soit S —< Vr,Vy,d > un système d'équations. Soit R = {A — à | A € Vy,a € d(A)} l’ensemble des 
règles associées au système S. Soit À € Vy. 
La grammaire GsA =< Vr,Vy,R,A > est la grammaire hors-contexte associée au système S et à la variable A. 


En pratique le passage d’un système à un ensemble de règles hors-contextes consiste à remplacer le signe = par la 
flêche — et le plus par la barre verticale. Par exemple le système 

Ao = aAg+bA; 

A] = aAjb+Ee 
est remplacé par les règles 

Ao — aAolbAi 

A, — aAble 
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Théorème 4.1 Soit S —< Vr,Vy,d > un système d'équations. 

La plus petite solution du système est l'interprétation I telle que pour tout À € Vy, I(A) = L(GsA). 

Autrement dit la composante de la variable A dans la plus petite solution du système est le langage engendré par la 
grammaire d’axiome À et dont les règles sont les règles associées au système. 


Preuve : Soit V = Vr UVy et À l’ensemble des règles associées au système S. 


1. L'interprétation I est une solution du système S. 
Par définition de I, il est clair que pour tout & € V*,I(&æ) = {xe Vi |a—=?x}. 


(a) Pour tout À € Vw, I(d(A)) C I(A). 


(b 


Z 


Soit x € I(d(A)). Par définition de I(d(A)), il existe & € d(A) telle que x € I(@). 
Par définition de R, À — & est une règle de la grammaire Gs4. 

Puisque x € I(@), d’après la propriété de I(@), à =? x 

Par suite x est un mot engendré par la grammaire Gs.4, donc x € I(A). 


Pour tout À € Vy, I(A) CI(d(A)). 

Soit x € I(A). Par définition de I, le mot x est engendré par la grammaire G5 4. 
Donc il existe © tel que À — ot est une règle de R et o 2 x. 

Par définition de R, & € d(A). D’après la propriété de I(œ), x € I(@). 

Donc par définition de I(d(A)), x € I(d(A)). 


2. L'interprétation I est la plus petite solution du système S. 
Soit J une autre solution du système. Soit À € Vy, x € V7, n un entier. 
Par induction sur n, on montre que pour tout n, si À =} x alors x € J(A). 
Suppposons que pour tout p Où p < n, Si À > x alors x € J(A) : c’est l'hypothèse d’induction. 


(a) Soit n = 0. Montrons que si À =} x alors x € J(A). 


(b 


Z 


Pour ñn = 0, on aurait À = x ce qui est impossible car À est une variable et x une chaîne terminale. Donc 
l'implication est vraie. 


Soit n > 0. Supposons À =? x. 

Il y a une règle À — à dans Reta =» ! x. 

Soit B (li de 1 à p) la Suite des symboles de ©. 

D’après la propriété fondamentale [ï]des grammaires hors-contextes : 

Pour i de 1 à p,B; fx; oùn—1—%k;etx=x...x,. 

Quand B; € Vr, par définition des dérivations on a B; — x; et par définition des interprétations, J(B;) — {B;}, 
donc x; € J(Bi). 

Quand B; € Vy, puisque k; < n, l'hypothèse d’induction est applicable, on a de même x; € J(B;). 

Par suite x1...x, € J(B1...B,), c’est-à-dire x € J(@). 

Puisque © € d(A), il résulte que x € J(d(A)) et puisque J est une solution du système S, J(A) — J(d(A)), 
donc x € J(A). 


Par le principe d’induction, pour tout n, si A =? x alors x € J(A), donc IC J. 
Par suite I est bien la plus petite solution du système d’équations. 


5 Transformation de systèmes d’équations 


Définition 5.1 (Relation entre systèmes d’équations) Soit Vr un ensemble de terminaux et Vy un ensemble de vari- 
ables. Soit S —< Vr,Vy,d > et S —< Vr,Vy,d' > deux systèmes d'équations. 

S’ est conséquence de S, si toute solution de S est solution de S. 

Ces deux systèmes sont équivalents s’ils sont les mêmes solutions. 
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5.1 Substitution simple 


Définition 5.2 (Substitution simple) Le système S' est obtenu par subsitution simple sur le système S s’il est obtenu 
en remplaçant dans une définition de S, une occurrence d’une variable par sa définition. 

Plus formellement soient S —< Vr,Vy,d > et S —< Vr,Vy,d' > deux systèmes. S' est obtenu par substitution simple 
sur S, s’il existe À,B € Vy, ABB € d(A)[]rer que : 

d'est identique à d sauf pour À et d'(A) = (d(A) — {aBB}) Uad(B)6. 


On va montrer que cette substitution change un système en un autre équivalent. On a besoin dans cette preuve d’une 
propriété sur les langages, que nous montrons ci-dessous. 


Propriété 5.1 Soient L,M,N,P.Q, cinq langages sur le même vocabulaire vérifiant les égalités 
P = LUMON 
Q = LÜUMPN 

Il en résulte que P=Q 


Preuve : 
1. Supposons ee Metee N. 
Puisque £ € M ete € N, on a Q C MON. D'après la première égalité MON C P.Donc QC P. 
De façon analogue, grâce à la deuxième égalité, on a P C Q, donc P = Q. 
2. Supposons eg Moue g N. 
On montre par induction sur x que x € P si et seulement si x € Q. 
(a) Supposons x — €. 
Supposons x € P. Puisque tout mot de MON n’est pas vide, d’après la première égalité x € L et d’après la 
deuxième x € Q. 
Réciproquement, de façon analogue si x € Q alors x € P. 
(b) Supposons x £ €. 
On admet l’hypothèse d’induction que tout mot, de longueur inférieure à celle de x, est élément de P si et 
seulement si il est élément de Q. 
1. Supposons x € L. Des deux égalités, il résulte immédiatement que x € P si et seulement si x € Q. 


ii. Supposons x & L. 
Supposons x € P. 
D’après la première équation x € MON, donc x = uvw avec u € M, v E Q,w € N. Puisque € & M ou 
€ & N, la longueur de v est inférieure à celle de x, donc par hypothèse d’induction v € P. 
Par suite x = uvw € MPQ, donc d’après la deuxième égalité x € Q. 
De façon analogue, x € Q implique x € P 
Donc x € P si et seulement si x € Q. Par le principe d’inducion, c’est vrai pour tout mot x, donc P = Q. 


Théorème 5.1 Soient deux systèmes d'équations dont l’un est obtenu par une substitution simple appliquée à l’autre. 
Ces deux systèmes sont équivalents. 


Preuve : Soient S —< Vr,Vw,d > et S' =< Vr,Vy,d' > deux systèmes. S’ est obtenu par substitution simple sur S. 
Donc il existe A,B € Vy, aBf € d(A) tel que : 
d'est identique à d sauf pour À et d'(A) — (d(A) — {aBB})Uad(B)f. 
1. Soit I solution de S. Montrons que c’est également une solution de S”. 
Il suffit de vérifier que I(A) — I(d’(A)). 


I(A) = I(d(A)) Car I est solution de S 
= I(d(A)—{aBB})UI(aBB)  Card(A) = (d(A)—{aBf})U {aBf} 
— I(d(A)-{aBB})UI(ad(B)B) Car I(B) = I(d(B)) puisque I est solution de S 
I( 


d'(A)) Par définition de d'(A) 


lRappelons que d(A) est la définition de A 
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2. Soit I une solution de S’. Montrons que c’est également une solution de S. 
Il suffit de vérifier que I(A) = I(d(A)). 
Puisque I est solution de S', I(A) — I(d'(A)) = I(d(A) — {aBB})UI(ad(B)B). 
(a) Supposons À £ B. 

Puisque seule l’équation définissant À est modifiée, d(B) — d'(B). 
Puisque I est solution de S”, I(B) — I(d’(B)) = I(d(B)). 
Donc en remplaçant I(d(B)) par la valeur qui lui est égale I(B) dans la valeur de I(A), on obtient : 
I(A) = 1(d(A) — {aBB})UI(aBB) —1(d(4)). 


Donc I est solution de S. 
(b 


Z 


Supposons À — B. 

MA) TAC) — {aAB})UlI(a)I(d(A))I(B) Car I est solution de S' et d’(A) — (d(A) — {aAB}) Uad(A)B 
I(d(A)) = 1(d(A) — {aAB}) UI(&)I(A)I(B) Car d(A) = (d(A) — {aAB})U {aAf} 

D’après la proposition[S.I|en instanciant L,M,N, P,Q respectivement par les ensembles Z(d(A) — {aAf}), 

I(@), I(B), I(A) et I(d(A)), on obtient I(A) = I(d(A)) 

Donc I est solution de S. 


5.2 Substitution générale 


Définition 5.3 (Substitution générale) Le système S' est obtenu par substitution générale sur le système S s’il est 
obtenu en remplaçant dans les définitions de S, des occurrences de variables par leur définition. 

Plus formellement soient S —< Vr,Vy,d > et S' =< Vr,Vy,d' > deux systèmes, S’ est obtenu par substitution générale 
sur le système S si : 

Pour tout À € Vy d’(A) = U{Ea | & € d(A)} er 

tout Ea est de la forme Bod(B1)B1 ...d(B;)Bn où n > 0, B1,...B, € Vy et à = BoBifi ... Baba. 


Notons qu’une subsitution simple est un cas particulier d’une substitution simple. 
La substitution générale, contrairement à la substitution simple, ne préserve pas nécessairement l’ensemble des solu- 
tion d’un système d’équations. Cependant, comme on le prouve ci-dessous, elle préserve la plus petite solution. 
Considérons l’exemple suivant. Soit le système S de terminaux a, b et de variables A,B et d'équations : 

A = B+a 

B = A+b 
En remplaçant à droite des équations, À et B par leur définition, on obtient le système S suivant : 

A = A+a+b 

B = B+a+b 
L'interprétation À = a+b+E€,B = a+ b est solution de S' mais n’est pas une solution de S. Donc la substitution 
générale ne préserve pas toutes les solutions. 
Par contre À = a+b,B = a +b est la plus petite solution des deux systèmes. 


Propriété 5.2 Soit S' un système obtenu par substitution générale sur le système S. 
Toute solution de S est solution de S. 


Preuve : Nous reprenons, pour les deux systèmes, les notations de la définition 5.3] 

Soit Eg = Bod(B:)B1 se .d(Bh)Bn où ñn > 0, B1,...B, € Vy et à = BoB1B:1 . BP. 

Si I est une solution de S$, alors pour tout à de 1 à n, I(B;) = I(d(B;)) et par suite I(Ea) = I(@). 
Donc pour tout À € Vy, par définition de d’(A), I(d(A)) —I(d’(A)). 

Puisque I est solution de S, pour tout À € VW, I(A) = I(d(A)), donc aussi I(A) — I(d'(A)). 

Par suite I est aussi solution de S’. O 


Propriété 5.3 Soit S' un système obtenu par substitution générale sur le système S. 
La plus petite solution de S est inférieure ou égale à la plus petite solution de S' pour l’ordre sur les interprétations 
défini comme comme l'extension de l’ordre de l’inclusion entre ensembles. 
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Preuve : Nous reprenons, pour les deux systèmes, les notations de la définition [5.3] 
Soient respectivement I et l’ les plus petites solutions de S et S. 
Rappelons que fs et fs sont les fonctions définies repectivement par S et S. 
D’après le théorème Bees deux fonctions sont continues, donc d’après la preuve du théorème de Kleene les suites 
fs(L) et fi (L) sont croissantes, et d’après le théorème|3.2] I=U{f(L) |ieN}, el’ =U{fi(L)|ieN}. 
1. Soit I une interprétation telle que I € fs(1). Montrons que fs(l) C fs (1) 
Puisque I C fs(1), par définition de fs, pour tout À € Vw, I(A) C I(d(A)). 
Soit À une variable et x une chaîne terminale telle que x € (fs(1) (A). Il suffit de montrer que x € (fsr(1))(A). 
Puisque x € (fs(1))(A) = I(d(A)), il existe & € d(A) tel que x € I(®). 
Puisque S’ est obtenue par substitution générale, on a : 
a = BoBif1 BB où pour i de 1 à n, B; est une variable et Bod(B1)fB1 ...d(B,)B: € d'(A). 
Puisque pour tout À € Vy, I(A) C I(d(A)), il en résulte que pour i de 1 à n, I(B;) C I(d(B;)). 
Puisque la concaténation de langages est croissante, on en déduit que I(@) C I(Bod(B1)fB1...d(B;)Bn). 
Puisque Bod(B1)B1...d(B:)Bn € d’(A), nous concluons que I(&) € I(d'(A)). 
Comme x € I(@), on a x € I(d’(A)) ; de plus, par définition de fs, I(d'(A)) = (fs(1))(A), donc x € (fs(1))(A). 
2. Montrons par induction sur i que pour tout i € N, f{(L) C fi(L). 
Pour i = 0 c’est trivial car f@(L) = L = f9(L) 
Supposons que fi(L) E FE TAR) 
On a rappelé ci-dessus que f{(_L) est une suite croissante, donc f{(L) € fs(fi(L)). 
Par suite on peut appliquer le résultat|1|du premier cas à l’interprétation HO) donc : 
6) BC) € fr(AECD). 
Puisque toute fonction continue est croissante d’après la propriété [2.1] fs est croissante. Comme par hypothèse 
d’induction fi(1) € f(L), il resulte de la croissance de fs: que : 


C4) fo (PSCL)) € fs (fs). 
Donc d’après (*) et (**), on a fét1(L) € fl) 
Puisque pour tout i € N, fi(L) € fi(L), que I est le plus petit majorant de la suite f{(_L) et J’ le plus petit majorant 
de la suite f},(L), il en résulte que Z C J'. 


Théorème 5.2 Soit S' un système obtenu par substitution générale sur le système S. 
Les plus petites solutions de S et de S' sont identiques. 


Preuve : Soient respectivement I et I’ les plus petites solutions de S et S’. 
D’après la propriété I est aussi solution de S’ donc l’ CI. 
D’après la propriété ICT. DoncI=T. 
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Chapitre VIII 


Transformations des grammaires 
hors-contexte 


1 Rappels du chapitre précédent 


Dans ce chapitre on présente des transformations de grammaires, préservant les langages engendrés et utiles pour 
rédiger des programmes efficaces d’analyse, c’est-à-dire des programmes pour reconnaître si un mot est engendré par 
une grammaire. 

La justification de certaines de ces transformations repose sur des résultats du chapitre précedent qui seront brièvement 
rappelés sous une forme qui devrait éviter la lecture de ce chapitre précédent à ceux qui souhaitent dans un premier 
temps faire l’impasse sur ces preuves. 


1.1 Grammaires et équations 


Une grammaire hors-contexte G —< Vr,Vy,S,R > peut être vue comme un système d’équations, avec une équa- 
tion par non-terminal. Soit V = Vr UVy. 
Soit À un non-terminal (que l’on appelle aussi une variable) et soit À — œ1|o]|...|@, où n > 0 et o1,02,...0, € V* 
l’ensemble des règles d’entête À. Cet ensemble de règles est vu comme une équation définissant À que l’on l’écrit 
A = + O2 +: + Om. 
Un système d’équations est la donnée d’un triplet < Vr,Vy,d >, où Vr est l’ensemble des terminaux, Vy est l’ensem- 
ble des variables, d est l’ensemble des équations entre une variable et une somme de mots dont les lettres sont des 
terminaux ou des variables. 
Les valeurs des variables sont des langages sur le vocabulaire terminal Vr. 
Une interprétation du système est une suite d’égalités entre les variables du système et des valeurs. 
Une interprétation est une solution du système, si les valeurs obtenues en remplaçant chaque variable par sa valeur 
dans les deux membres de chaque équation du système, sont égales. 
On ordonne ainsi les interprétations : soient I et J deux interprétations d’un système, I est inférieure ou égale à J (ce 
qu’on note I C J) si et seulement si pour toute variable À du système la valeur de À donnée par I est un sous-ensemble 
de la valeur de À donnée par J. 


Exemple 1.1 Soit la grammaire G de vocabulaire terminal a,b, de vocabulaire non-terminal À,B, d’axiome À et de 


règles : 
A —  aA|B 
B — elaBb 
On peut voir G comme un système d'équations : 
À = aA+B 
B — £e+aAb 


L'interprétation À = {ab,a,aba},B = {b'a|n € N} n'est pas une solution du système. 
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Par contre l'interprétation À = {a"b? | n > p},B = {a"b" | n > 0} est une solution de ce système d'équations, qui n’a 
d’ailleurs qu’une seule solution. 


Il y a des systèmes d’équations qui ont plus qu’une solution. Par exemple le système À = À + a + b de variable À et de 
terminaux a,b possède une plus petite solution À — {a,b}. Mais À — L où L est un langage quelconque tel que a,b € L 
est une aussi une solution. 

La relation entre les solutions et les grammaires est résumée par le résultat suivant. 


Théorème 1.1 Soit G=< Vr,Vw,S,R > une grammaire hors-contexte. Une interprétation est la plus petite solution 
du système associé à la grammaire si et seulement si pour tout non-terminal À, la valeur de A dans l'interprétation est 
le langage engendré par le non-terminal À avec les règles de G. 


Pour les courageux, qui veulent lire la preuve, voir le théorème[Æ.T]du chapitre[X] 


12 Des substitutions, qui préservent les langages 


Définition 1.1 Soit G—< Vr,Vy,S,R > une grammaire hors-contexte et V = Vr UVn—. On appelle définition du non- 
terminal À et l’on note par d(A) l’ensemble des parties droites des règles d’entête À. 
La grammaire G =< Vr,Vy,S,R' > est obtenue par substitution générale sur G, si les règles de G’ sont obtenues en 
remplaçant dans les parties droites de règles des variables par leurs définitions. 
Plus précisément pour chaque règle À — @ de la grammaire G, il existe n > 0, des mots Bo,fB1....B; de V*, des 
variables B1,...B, € Vx tel que 

— &— BoBiB: .. -Bufn 

— d'(A) la définition de A dans R' est l’ensemble Bod(B1)B1 ...d(B)Bn 


Théorème 1.2 Soit G’ obtenue par substitution générale sur la grammaire G. Les deux grammaires sont équivalentes. 


Pour les courageux, qui veulent lire la preuve, voir le théorème[5.7]du chapitre[TX] 


13 Treillis fini et calcul de points fixes 


On rappelle qu’un treillis est un ensemble ordonné dans lequel tout sous-ensemble fini non vide a une plus petite borne 
supérieure et une plus petite borne inférieure. 


Théorème 1.3 Soit E un treillis fini ayant un plus petit élément L. Soit n le nombre d'éléments de E. 
Soit f:E + E une fonction croissante. 

La suite f'(L) est une suite croissante. 

Le plus petit point fixe de f est f/(L) où j est le plus petit entier tel que j <n et f(1)= fi (1). 


Pour les courageux, qui veulent lire la preuve, voir le paragraphe[23] 


2 Réduction d’une grammaire hors-contexte 


Soit G—=< Vr,Vy,S,R > une grammaire hors-contexte. Soit V = Vr U Vy. 


2.1 Calcul de l’ensemble des symboles productifs 


Le non-terminal À € Vy est productif si et seulement si il existe une chaîne terminale x telle que À * x. Un non- 
terminal improductif ne figure dans aucune dérivation dont l’extrémité est une chaîne terminale. 

L'ensemble des symboles productifs peut aussi être défini par induction comme étant le plus petit ensemble de non- 
terminaux tel que À est productif si et seulement si il y a une règle À — © dans la grammaire, telle que toutes les 
variables de & sont productives. Prouvons que ces deux manières de définir l’ensemble des productifs sont équivalentes. 
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Théorème 2.1 Soit f : P(V») — P(Vy) la fonction suivante : 
Pour tout E © Vy, f(E) = {AE Vw| 20€ (VrUE)" tel que À — @E R}. 
L'ensemble des symboles productifs est le plus petit point fixe de f 


Preuve : Soit P l’ensemble des symboles productifs. 
1. L'ensemble P des symboles productifs vérifie f(P) = P. 


(a) Soit A € f(P). Donc il existe une règle À — & dont tous les symboles de & sont des terminaux ou produisent 
des chaînes terminales. Par composition des dérivations À produit une chaîne terminale, donc À € P. 


(b) Soit À € P. Il existe © et une chaîne terminale x tel que À — & € R et & —* x. Par décomposition des 
dérivations, chaque symbole de © est un terminal ou un non-terminal produisant une chaîne terminale. 
Donc à € (Vr UP) et par suite À € f(P). 


2. Pest la plus petite solution. 
Soit Q une solution quelconque. Il suffit de vérifier que P C Q. 
Montrons par induction sur À que : 
(*) pour tout non-terminal À et toute chaîne terminale x tel que À six onaAE€ Q. 
Pour i — 0, la propriété est vérifiée car À = x est impossible. Soit i > 0. Supposons, par induction, que pour 
tout j < i, pour tout non-terminal À et toute chaîne terminale x tel que À =/xonaA € Q. 
Soit le non-terminal À et la chaîne terminale x tels que À = x. 
Puisque i > 0, il existe a tel que A ae Retail x. 
Par décomposition des dérivations, chaque non-terminal de & engendre en au plus i — 1 pas une chaîne terminale, 
donc par hypothèse d’induction est élément de Q. 
Par suite & € (Vr UQ)*, donc A € f(Q). Puique O = f(Q),onaA € Q. 
Par application du principe d’induction, la propriété (*) est vraie pour tout entier i. 
Soit À € P. Il existe i et une chaîne terminale x telle que À — x. 
D’après la propriété (*), vraie pour tout i, ona A € Q 


Le théorème ci-dessus nous donne un moyen de calculer l’ensemble P des non-terminaux productifs. En effet f est 
une fonction croissante sur le treillis fini P(Vy), ordonné par l'inclusion et dont le plus petit élément est O. Puisque P 
est le plus petit point fixe de f, d’après le théorème 1.3] P = fJ(0) où j est le plus petit entier tel que f/(0) = f/+1(0). 
D’après ce même théorème, f'(0) est une suite croissante d’ensembles. Soit n le nombre de non-terminaux, puisque 
f'(6) est une suite croissante, on a j < n. 

Donc la valeur de P est obtenue en appliquant au plus n fois la fonction f. 


Exemple 2.1 Soit la grammaire ayant un terminal a, les non-terminaux À, B, C, D, E et de règles À — B, B—C., 
C—D,D—a D —E, E — EA. 
On calcule la suite f'(O) jusqu'à la stabilité de la suite : 


f°(@) = 0 


f'(@) = {D} 

f°(@) = {D,C} 

f°(@) = {D,C;B} 

f*(0) = {D,C;,B;A} 
5(0) =  {D,C,B,A} 


Donc le non-terminal E est improductif et les autres terminaux sont productifs. 


Exercice 2.1 Montrer que f'(0) est l’ensemble des symboles produisant une chaîne terminale avec un arbre de déri- 
vation de hauteur au plus égale à i. 


2.2 Calcul de l’ensemble de l’ensemble des symboles accessibles 


Un non-terminal B est accessible à partir du non-terminal À si et seulement si il existe deux chaînes &,B € V* telles 
que À =* aBf. 
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Un non-terminal est accessible relativement à une grammaire si et seulement si il est accessible à partir de l’axiome 
de la grammaire. 

Évidemment un non-terminal inacessible ne figure dans aucune dérivation à partir de l’axiome, donc est inutile. 

Soit d la relation de dépendance sur Vy définie par : 


AdB si et seulement il existe deux chaînes ot, B € V* telles que À — aBB € R. 

Notons d* la fermeture reflexive et transitive de la relation d. Il est évident que B est accessible à partir du non-terminal 
À si et seulement si À d*B. 

Comme la relation d est une relation sur l’ensemble fini des non-terminaux, il y a des algorithmes pour la calculer. 
Nous donnons ci-dessus l’algorithme de Roy-Warshall, qui est applicable à tout ensemble fini. 

Soit À; où à va de 1 à n, une liste sans répétition des éléments de Vy. 

Notons d, la relation suivante : A;dyA ; si et seulement il y a un chemin (pour la relation d) entre À; et A; dont les 
sommets intermédiaires sont d’indice au plus égal à k. 

Il est (presque) évident que ces relations vérifient : 


1. A;doA ; si et seulement si A;dA ; ou i— j 
2. d* = d, car nest le plus grand indice possible 


3. Soit & > 0. A;d;A ; si et seulement si A;jdy_1A; ou (A;ds_1A} et Ajdy_1A;) car s’il y a un chemin entre À; et 
A; passant par des sommets d’indice au plus &, il y un chemin entre À; et À ; passant une seule fois par un tel 
sommet. 


Cela donne un calcul de d* en un temps de l’ordre de n°, car il suffit de calculer chacune des n relations de, où k > 0, 
et que le calcul de dy necessite de calculer les n? couples de cette relation. 


2.3 Construction d’une grammaire réduite 


Définition 2.1 Une grammaire hors-contexte est réduite si et seulement si tous ses symboles sont productifs et acces- 
sibles. 


Théorème 2.2 Soit G une grammaire hors-contexte telle que L(G) 0. On peut construire une grammaire réduite 
équivalente à G. 


Preuve : Soit G=< Vr,Vy,S,R >. 


1. Élimination des improductifs. 
Soit P l’ensemble des symboles productifs de la grammaire. 
Puisque L(G) n’est pas vide, P comporte au moins l’axiome S. 
Soit R’ l’ensemble des règles de G ne comportant pas de symboles improductifs et soit G' =< Vr,P,S,R' >. 
On montre aisément que pour tout À € P et toute chaîne terminale x : À &% x si et seulement si À 4; x. 
Puisque S est l’axiome de G’, il en résulte que les deux grammaires sont équivalentes. 
Puisque P est l’ensemble des non-terminaux de G, il en résulte que tous les non-terminaux de G’ sont productifs. 


2. Élimination des inaccessibles. 
Soit Q l’ensemble des symboles accessibles de la grammaire G7. 
Soit R” l’ensemble des règles de G’ ne comportant pas de symboles inaccessibles et soit G” =< Vr,Q,S,R" >. 
On montre aisément les propriétés suivantes de G/ 


(a) pour tout & € V*, si S 4, & alors S 4, ©. 
La preuve est une preuve facile mais fastidieuse sur la longueur des dérivations. 


(b) pour tout & € V*, sis > Gr @ alors S > a. 


Ce résultat résulte de ce que toute règle de G/ est une règle de G7. 


(c) pour tout À € Q et toute chaîne terminale x, si À => x alors À Gr x. 
La preuve est une preuve facile mais fastidieuse sur la longueur des dérivations. 
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D’après la propriété Pal tous les symboles accessibles dans G’, le sont dans G/, donc tous les non-terminaux de 
G”' sont accessibles. 

D’après la propriété Edet le fait que tous les non-terminaux de G’ sont productifs, il résulte que tous les non- 
terminaux de G” sont productifs. 

Donc la grammaire G/' est réduite. 

Des propriétés Palet£bl] il résulte que les grammaires G” et G” sont équivalentes. 


Puisque les grammaires G et G’ sont équivalentes, il en résulte que les grammaires G et G/’ sont équivalentes. 

Puisque l’on a vu au paragraphe [.T]|comment calculer P, l’ensemble des symboles productifs de G, et que l’on a vu 
au paragraphe L.2]comment calculer Q, l’ensemble des symboles accessibles de G’, on sait comment construire une 
grammaire G/’ réduite et équivalente à G. 


Remarque 2.1 On peut résumer ainsi la transformation d’une grammaire en une grammaire réduite équivalente, 
enlever d’abord les non-terminaux improductifs (et les règles qui en comportent) puis enlever les non-terminaux inac- 
cessibles (et les règles qui en comportent). Si on procéde dans l’ordre inverse, il n’est pas certain que la grammaire 
obtenue est réduite comme le montre l’exemple suivant. 

Soit G la grammaire de terminaux a, b, c, de non-terminaux S,A,C,D,E, d’axiomeS et de règles S — A,S — a, À — CD, 
C—c, D—A,E — b. 

Le non-terminal E est le seul symbole inacessible. En l’enlevant, on obtient la grammaire G' de non-terminaux 
S,A,C,D, d’axiome S et de règles S — A,S — a, A — CD, C — c, D — A. 

Les non-terminaux A, D, sont les seuls symboles improductifs. En les enlevant, on obtient la grammaire G” de non- 
terminaux S,C, d’axiome S et de règles S — a,C — c. 

La grammaire obtenue comporte le symbole inaccessible C : elle n’est pas réduite. 


3  Élimination des €-règles 


Savoir éliminer les e-règles n’a de nos jours aucun intérêt pratique, car les analyseurs savent les utiliser. Mais cela 
permet de justifier ce qui avait été dit sans preuve au chapitre M]: tout langage hors-contexte ne comportant pas la 
chaîne vide, est sous-contexte. En effet les règles hors-contextes, dont la partie droite n’est pas vide, sont aussi des 
règles sous-contextes, comme on le voit dans la classification des grammaires Bldu chapitre [M] 


Théorème 3.1 Soit G —< Vr,Vn,S,R > une grammaire hors-contexte. On peut construire une grammaire hors- 
contexte G=< Vr,Vn,S,R' > sans e-règle telle que L(G') = L(G) — {e}. 


Preuve : On montre d’abord comment construire l’ensemble des non-terminaux engendrant la chaîne vide, puis on 
détaille la construction de G’, enfin on montre que L(G”’) C L(G)— {e} et L(G) —{e} C L(G'). 


1. Construction de E l’ensemble des non-terminaux engendrant la chaîne vide. 
Cette construction est analogue à celle de l’ensemble de symboles productifs étudiée au paragraphe [2.1] aussi 
nous laissons au lecteur les justifications plus précises de cette construction. 
Soit f : P(Vy) + P(V») la fonction suivante : 
Pour tout X C Vw, f(X) = {A € Vy | Ja tel que À — œ et & € X*}. 
Il est clair que f est croissante et que Æ est le plus petit point fixe de f. 
Donc E = f/(0) où j et le plus petit indice tel que f/(0) — f/+1(0). 
De plus, puisque la suite f'(0) est croissante, j est inférieur au nombre de non-terminaux de la grammaire. 


2. Construction de R'. 
R! est obtenu en effaçant,dans les parties droites des règles de G, de toutes les manières possibles les non- 
terminaux produisant la chaîne vide. 
Plus formellement R’ est l’ensemble de règles À — B1.. -B, où 
— p>0Oetpouride 1 àp,B;EV 
— ilexiste une règle de G s’écrivant À — @1B1...04pBhOp+1 Où O,..., Op, Op+1 € E*. 
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3. LG) © L(G) - LE}. 
Puisque G’ est sans &-règle, la chaîne vide n’est pas élément de L(G'), aussi il suffit de montrer, par induction 
Sur À, que : 

Pour tout non-terminal À et toute chaîne terminale x, si À > G x alors À 6 x 
Pour i — 0, la propriété est "trivialement" vraie, car il est impossible que À = x. 
Supposons i > 0 et admettons l’hypothèse d’induction, que la propriété est vérifiée pour toute dérivation de 
longueur inférieure à i. 

Supposons À x. Puisque i > 0, cette dérivation s’écrit : 

AG B1...B, =" xoù B1,...Bp € V. 

En utilisant la propriété fondamentale des langages hors-contexte (voir chapitre [M] théorème NT}. ainsi que 
l'hypothèse d’induction, il existe des chaînes terminales x1,...x, telles que 

— X=X1...Xp 

— pour jdel1àp,B; 6x; 

Par définition de G?, il existe 1, > Up Op+1 € E* telles que À — &1B1...4,B,0,+1 est une règle de G. 
Puisque E est l’ensemble des non-terminaux produisant la chaîne vide dans la grammaire G, toutes les chaînes 
O,... Xp, +1 produisent la chaîne vide dans cette grammaire et par composition des dérivations, on a : À 4 x. 


4. L(G)- {e} C L(G'). 
Il suffit de montrer,par induction sur i, que : 
Pour tout non-terminal À et toute chaîne terminale non vide x, si À =% x alors À >G x 
Pour i — 0, la propriété est "trivialement" vraie. 
Supposons i > 0 et admettons l’hypothèse d’induction, que la propriété est vérifiée pour toute dérivation de 
longueur inférieure à i. 
Supposons À sb x. Puisque i > 0, cette dérivation s’écrit : 
A=GB1...B,=5xoùB,...8B,€V. 
D’après la propriété fondamentale des langages hors-contexte, il existe pour j de 1 à p, des entiers n; et des 
chaînes x; tel que : 
CB; 0 etx—x1...xXpeti—-l=n +...+n,. 
Soient k,...,k, la suite croissante des indices des chaînes x; non vides. 
Par définition des règles de G’ et de ces indices : 
(##) À — Bx, .…..Bx, est une règle de G', 
obtenue en supprimant les non-terminaux B ; qui engendrent des chaînes vides. 
Puisque, d’après la propriété (*), pour tout j de 1 à p,n; < i, il résulte, en appliquant l'hypothèse d’induction à 
cette même propriété que : 
(***) Pour j de 1 à q, Bk; 6 Xk; 
D’après les propriétés (*),(**) et (**#), en composant les dérivations, on a : À 6 x. 
Par induction la propriété encadrée ci-dessus est donc vérifiée pour tout i. 


Exemple 3.1 Soit la grammaire de terminaux a,b, de non-terminaux S, À, B, C, d’axiome S et de règles : 
S — ABC,A — BB|£,B — CC|a,C — AAÏb 
Tous les non-terminaux produisent la chaîne vide, donc la grammaire équivalente sans £-règles a comme règles : 


S + ABC|BC|AC|AB|A[B|C 


À — BB|B 
B — CC|Cla 
C — AAÏA|b 


Cet exemple met en évidence que l'enlèvement des règles produisant la chaîne vide peut augmenter considérablement 
le nombre de règles. 


Théorème 3.2 Soit G—< Vr,Vy,S,R > une grammaire hors-contexte. Si L(G) n’est pas vide, on peut construire une 
grammaire hors-contexte G' =< Vr,Vn,S,R' > réduite et sans e-règle telle que L(G') = L(G) — {e}. 
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Preuve : On élimine d’abord les e-règles, comme il a été indiqué ci-dessus, on obtient alors une grammaire 
Gi =< Vr,Vy,S,R; > sans e-règle telle que L(G:) = L(G) — {e}. 

On élimine ensuite les non-terminaux improductifs puis les non-terminaux inaccessibles. Ces éliminations ne faisant 
qu’enlever des règles, la grammaire obtenue G2 =< Vr,Vy,S,R: > est réduite, équivalente à G et sans e-règle. 
Par suite en posant R/ — R2, G’ — Go, la grammaire G/ —< Vr,Vw,S,R' > est réduite et vérifie L(G’) = L(G) — {e}. 


4  Élimination des 1-règles 


Rappelons qu’une 1-règle est une règle de la forme À — B où B est un non-terminal. L’élimination n’a plus qu’un 
intérêt historique et doit être vu comme un exercice sur les transformations de grammaire. 


Théorème 4.1 Soit G —< Vr,Vy,S,R > une grammaire hors-contexte. On peut construire une grammaire hors- 
contexte équivalente sans 1-règle G =< Vr,Vn,S,R! >. 


Preuve : On montre comment construire G’, ensuite on prouve L(G’) C L(G) puis L(G) € L(G'). 


1. Construction de G?. 
Soit r la relation sur Vy définie par : ArB si et seulement si À — B est une règle de G. 
On a donné au paragraphe [2.2] l’algorithme de Roy-Warshall qui permet de calculer facilement r* la fermeture 
transitive et reflexive de r. 
On pose : R' —{A —a| ilexist B—aecRet ag Vyet Ar*B}. 
Puisque r* est calculable, il en de même de R’. 
2. L(G') C L(G). 
On donne uniquement l’argument essentiel de la preuve, toute règle de R’ peut être remplacée par une dérivation 
dans G, c’est-à-dire si À — © € R' alors À > ©. 
3. L(G) CL(G). 
On prouve par induction sur i que : 
si À est un non-terminal et x une chaîne terminale telle que À 4 x alors À 4, x. 
Par hypothèse d’induction, supposons la propriété vraie pour toute dérivation de longueur inférieure à 5. 
Supposons À ae x. Il y a une dérivation de À en x, qui s’écrit &o,...0t; où Oo = À et O; = X. 
Puisque À est un non-terminal et que x est une chaîne terminale, il y a un indice j entre 0 et i — 1 tel que &o,...c; 
sont des non-terminaux et que la chaîne @;,, n’est pas un non-terminal. 
Par définition de R’, À — @;,1 et une règle de R'. 


Puisque Go, ...0; est une dérivation de la grammaire G,on a @;;1 Si GH), 

Puisque i— (j +1) < i, en appliquant la propriété fondamentale des grammaires hors-contexte et l’hypothèse 
d’induction, on obtient : @j+1 {y x. 

Par suite À =%; x. 


Donc la propriété encadrée ci-dessus est vraie pour tout à, d’où L(G) C L(G'). 


Exemple 4.1 Soit la grammaire de terminaux +, *, (, ), de non-terminaux E,T,F, d'axiome E et de règles 
E — E+TI 
T — T+F}F 
F —  (E)la 
On a: ErE,ET, EE TT, Tr'E,Fr'F. 
Par suite les règles de la grammaire équivalente sans 1-règle sont 
E — E+TIT+F|(E)|a 
T — T+F|(E)la 
F —  (E)la 
On constate que cette grammaire a bien plus de règles. 
Appelons expression un mot engendré par E, terme un mot engendré par T et facteur un mot engendré par F. 
La nouvelle grammaire ne met plus en évidence ni que tout terme est une expression , ni que tout facteur est un terme. 
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Théorème 4.2 Soit G —< Vr,Vn,S,R > une grammaire hors-contexte. Si L(G) n’est pas vide, on peut construire une 
grammaire hors-contexte G —< Vr,Vn,S,R' > résuite, sans e-règle et sans 1-règle telle que L(G') = L(G) — {e}. 
Un grammaire ayant ces propriétés est appelée une grammaire propre. 


Preuve : Il suffit d'appliquer dans l’ordre les transformations suivantes : élimination des e-règles, élimination des 
1-règles, élimination des improductifs, élimination des inaccessibles. 

En effet puisque l’élimination des 1-règles n’ajoute pas de nouvelle partie droite de règle, la grammaire construite par 
la deuxième élimination n’a pas £-règles. Il en est de même des deux dernières éliminations : la grammaire finale G/ 
est donc propre. 


Puisque ces différentes éliminations change une grammaire en une autre grammaire équivalente à € près, on a bien 
L(G7) = L(G)—{e}. 


5 Forme normale de Chomsky 


La forme normale de Chmosky n’a plus qu’un intérêt historique. Aussi comme le paragraphe précédent, il faut voir ce 
paragraphe comme l’exposé de méthodes pour prouver l’équivalence de grammaires. 


Définition 5.1 (Forme Normale de Chomsky) Une grammaire hors-contexte est sous forme normale de Chomsky si 
toutes ses règles sont de l’une des deux formes suivantes : 

— À — BC où À, B, C sont des non-terminaux 

— À — a où a est un terminal 


Théorème 5.1 Soit G une grammaire hors-contexte. On peut construire une grammaire G' sous forme normale de 


Chomsky telle que L(G') = L(G) — {e}. 


Preuve : D’après le théorème El pour toute grammaire hors-contexte, on peut construire une grammaire propre 
équivalente à € près. On peut donc supposer que la grammaire G est sans £-règle et sans 1-règle. 
Posons G=< Vr,Vy,S,R > et soit V = Vr UVxw. 
La grammaire G’ =< Vr,V},[S],R' > est construite ainsi 
— Les symboles de VY sont obtenus en mettant entre crochets les éléments de V et les suffixes de longueur au 
moins deux des parties droites de règles de R , autrement dit : 
Vy = {[B]|BEV}U{[o] | il existe $ tel que [a] > 2,4 —$acR} 
— Les règles de R’ sont 
R' = {[A] — [B1][B2...B,]|A — BiB2...B,€R, Bi,B2,...,B}EV, p>2} 
U{[B1B2. ..Bp] — [B1][B2 7 .B>] | [B1B2.. .B>] = VY,p >2} 
U{[a] — a | a € Vr} 
U{[A] - alA—aeR avec a € Vr} 
La grammaire G’ est sous forme normale de Chomsky. Montrons qu’elle est équivalente à G. 


1. Montrons que L(G) C L(G). 
Il suffit de prouver, par induction sur i, que : 

si À est un non-terminal et x une chaîne terminale tel que À 4% x alors [A] > GX. 

Pour i — 0, c’est trivial. 

Pour i > 0, supposons la propriété vraie pour toute dérivation de longueur inférieure à i. 

Supposons À en x. Puisque i > 0, cette dérivation s’écrit : 

A=GB1...B,=5xoùB,...8B, € V. 

D’après la propriété fondamentale des langages hors-contexte, il existe pour j de 1 à p, des entiers n; et des 

chaînes x; tel que : 

(8; Eur etx—x1...xXpeti—-l=n +...+n,. 

On considère deux cas suivant la valeur de p. 

(a) p=l1. 

Vu que G ne comporte pas de 1-règle, B1 est un terminal égal à x. Donc [A] — x est une règle de G’ donc 
[A] engendre x (en un pas) dans la grammaire G?. 
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() p> 1. 
Par définition de R’, il est clair que [A] =#;, [B1][B2]...[B,], d’ailleurs en exactement p — 1 pas. 
On distingue deux cas suivant que B; (où 1 < i < p) est un terminal ou un non-terminal. 
i. si B; est un terminal alors B; = x; et, par définition des nouvelles règles, [B;] — x; € R’, donc [B;] > Xi. 
ii. si B; est un non-terminal, puisqu'il engendre x; en moins de à pas, par hypothèse d’induction, on a 
aussi [B;] =£; xi. 

Par composition de ces dérivations, [B1][B2]...[B,] =%, x1x2...xn. 

Puisque x = x1...x, et que [A] 2 [B1][B>]...[B,|, il en résulte que [A] GX. 
Montrons que L(G’) € L(G). 
Nous présentons une preuve informelle comportant seulement l’argument essentiel. 
Supposons que |S] engendre la chaîne terminale x dans G/. Il y a une dérivation de G7, de x à partir de [S]. En 
effaçant les crochets de cette dérivation, on obtient une dérivation (avec des répétitions) de x (qui n’a pas de 
crochets) à partir de S dans la grammaire G. 
Soyons plus formel. Soit h : Vw + Vx l'application qui efface les crochets, autrement dit : 
Pour tout & € V* tel que [a] € VY alors A([a]) = a. 
Soit V’ = Vr UV. L'application h est étendue en un homomorphisme pour la concaténation de V'* dans V* en 
posant 
— pour tout a € Vr, h(a) = a 
— pour tous x,y € V*, h(xy) = A(x)h(y) 
En examinant tous les règles de R’, on voit que si [a] — B est une règle de R’ alors soit A([a]) — A(B), soit 
h([æ]) — B est une règle de R. On en déduit facilement que L(G’) C L(G). 


Exemple 5.1 On montre la transformation de grammaire ci-dessus. Soit la grammaire de terminaux a, b, de non- 
terminaux S,A,B, d’axiome S et de règles 

S$ — aAB|BBBA 

A — BABla 

B — ASlb 
La nouvelle grammaire équivalente a comme non-terminaux [a], [b], [S], [A], [B], [AB],[BBA],[BA], comme axiome [S] et 
comme règles 


s + [al[AB] | [B(BBA] 
AB]  — [AÏB] 

BBA] — [B|[BA] 

BA] — [(BlA] 

A]  — [BIAB||a 

B]  — [AÏSI|b 


Remarquez que le non-terminal [b] est inutilisé. 


6 Grammaires hors-contexte récursives 


Définition 6.1 Soit G = Vr,Vy,S,R > une grammaire hors-contexte et V = Vr UVWy. 
Un non-terminal À est 

— récursif si et seulement si il existe &,B € V* tel que À =* aAf. 

— récursif à gauche si et seulement si il existe & € V* tel que À =* Aa. 

— récursif à droite si ef seulement si il existe à € V* tel que À =* oA. 


Une grammaire hors-contexte est récursive (respectivement récursive à gauche, récursive à droite si elle contient un 
non-terminal récursif (respectivement récursif à gauche, récursif à droite). 


Propriété 6.1 Le problème « la grammaire G est-elle récursive ?»> est décidable. 
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Preuve : Il suffit de montrer que le problème «le non-terminal À de la grammaire G est-il récursif ?» est décidable. 
Soit d la relation de dépendance sur Vy définie au paragraphe [7] 

Il est clair que À est récursif si et seulement si AdTA où d est la fermeture transitive de cette relation de dépendance. 
Dans le paragraphe [2.2] on à vu comme calculer d*, la fermeture transitive et réflexive de d. La calcul de d*,la ferme- 
ture transitive de d, est analogue, il suffit de modifier la définition de do par : 

A;doA ; si et seulement si A;dA;. 


Les deux paragraphes suivants, on montre que pour toute grammaire hors-contexte, on peut construire une grammaire 
sans symbole récursif à gauche. Cette transformation est appelée l'élimination de la récursivité à gauche. Il a plusieurs 
façons d’effectuer cette élimination. Nous avons choisi une méthode élémentaire (mais qui n’est pas la meilleure), ef- 
fectuer une suite d’éliminations de règles directement récursives à gauche, c’est-à-dire de règles de la forme À — Ac. 
L’élimination de la récursivité gauche (respectivement droite) est encore actuellement une transformation importante, 
car les analyseurs descendants (respectivement ascendants) exigent des grammaires non-recursives à gauche (respec- 
tivement non-récursives à droites). 


7 Elimination des règles directement récursive à gauche 


Définition 7.1 Un non-terminal À est directement récursif à gauche dans une grammaire si la grammaire comporte 
une règle de la forme À — Act. 


Théorème 7.1 Soit G = Vr,Vn,S,R > une grammaire hors-contexte et V = VrÜUVy. 
Soit À un non-terminal directement récursif à gauche et soit A! un nouveau non-terminal, autrement dit A & V. 
Soit G'=Vr,VyU{A'},S,R' > la grammaire où l’ensemble R' est obtenu en remplaçant les A-règles (c'est-à-dire les 
règles d’entête À) par 
{A—B|A—BERerf ne commence pas par A} 
U{A — BA’ |A—$ER et B ne commence pas par A} 
U{4' — a|A—AQ@ER)} 
U{A4' — aA'|A— AGE R}. 
On a les résultats suivants : 
— Les deux grammaires sont équivalentes. 
— À n'est pas directement récursif à gauche dans G’. 
— Si G ne comporte pas la règle À — À, alors A’ n’est pas directement récursif à gauche dans Gr. 


Preuve : Il est évident, par construction de G’, que, dans la nouvelle grammaire, À n’est pas récursif à gauche et A’ 
non plus, à condition que À — À ne soit pas une règle de G. 

On montre que L(G) € L(G’), en donnant uniquement l’argument essentiel, et on laisse au lecteur la preuve (analogue) 
de l’inclusion inverse. 

Dans le début d’une dérivation gauche à partir de À d’une chaîne terminale il y a un premier pas qui ne commence pas 
par À, donc il existe p > 0 tel que le début de cette dérivation s’écrit : 

Pour i de 1 à p, A@;_1...0ù — AGO... (par la règle À — Aot; de G) 

AOpOp1... O1 = Boy... par la règle À — B où B ne commence pas par A. 

Vu le remplacement des récursions directes gauches par des récursions directes droites, on a aussi dans G’ : 

A =, Ba» ...o. En effet : 


1. Si p — 0, alors À — f, est une règle commune à G et G’. 


2. Sip > 0, alors dans Gil y a la dérivation droite : 
A = BA’ 
Pour i de p à 2, Ba, ...@;,14" = Ba,...0,104/ (par la règle A’ — a;A' de R') 
Ba, .…..o24’ = Ba, ...oou (par la règle A’ — 1 de R') 


On en déduit que si le non-terminal À engendre une chaîne terminale x par dérivation gauche dans G, alors À engendre 
x dans G?. 
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D’après la propriété[.2]du chapitre [M] si le non-terminal À engendre une chaîne terminale x dans G, alors il engendre 
aussi x par dérivation gauche. 

Par suite toute chaîne terminale engendrée par un non-terminal de G est aussi engendrée par ce même non-terminal 
dans G’. Donc L(G) C L(G'). 

On prouve de façon analogue, en remplaçant les dérivations gauches par des dérivations droites, que L(G”’) € L(G). 


Exemple 7.1 Soit la grammaire de terminaux ab, de non-terminal S et de règles : 

S — SSlaSb{e. 

En éliminant la récursion gauche directe, on obtient une grammaire d’axiome S et de règles 
S —  aSbS'|S'\aSble 
S — SS'|S 


La récursion directe gauche a été éliminée, mais les non-terminaux S et S' sont récursifs à gauche. 


8 Elimination de la récursivité à gauche 


On élimine la récursion à gauche, car les analyseurs descendants (ceux qui analysent les mots en essayant de construire 
une dérivation à partir de l’axiome) exigent des grammaires non récursives à gauches. 

Nous donnons ci-dessous deux exemples modèles où l’élimination de la récursion gauche est effectuée simplement en 
la remplaçant par une récursion droite. 


Exemple 8.1 Rappelons la grammaire des expressions arithmiques. 
E — E+TIT 
T — T+F}F 
F —  (E)la 
On peut éliminer la récursion à gauche simplement en la remplaçant par 
E — T+EIT 
T — FxT}F 
F —  (E)la 
La nouvelle grammaire, sans récursion gauche, est bien plus courte et plus descriptive que celle résultant des méthodes 
ci-dessous. 


Exemple 8.2 La grammaire suivante, décrivant des listes de a 


L — Las 
est équivalente à la grammaire sans récursion gauche 
L — al} 


Cet exemple montre que, contrairement aux méthodes ci-dessous, l'élimination des £-règles n’est pas un préalable 
indispensable à l'élimination de la récursion à gauche. 


Nous proposons ci-dessous un algorithme d’élimination de la récursion gauche, qui opère sur les grammaires sans €- 
règle et sans 1-règle. Il existe d’autres algorithme] qui n’obligent pas à respecter ces deux conditions et introduisent 
moins de non-terminaux en faisant l’analogue de l’élimination directe à gauche simultanément sur plusieurs non- 
terminaux : l’intérêt de ces algorithmes plus complexes est notammant de mieux respecter les qualités «descriptives» 
des grammaires, comme sur les exemples ci-dessus. 


Algorithme 8.1 Soit G—<Vr,Vy,S,R > une grammaire hors-contexte sans £-règle et sans 1-règle. Soit V =VrÜUV— 
et A1,...,A, une liste sans répétition des non-terminaux de G. 

On construit une suite G(j1<i<n+1) de grammaires ainsi définies. 

Gi =G 

Soit G; —=< Vr,Vn,,S,R; >. On montre comment, pour i < n, on obtient G;,1 à partir de G:. 

La construction comporte deux étapes 


lVoir par exemple la thèse de Jérome Bordier 
Méthode pour la mise au point de grammaires LL(1) 
Université Joseph-Fourier - Grenoble I (1971-01-30), Jean-Claude Boussard (Dir.) 
http://tel.archives-ouvertes.fr/docs/00/04/81/34/PDF/tel-00009479.pdf 
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1. Pour j de 
Gi1 = Gi. 
Pour j < 


Ï'à i on constuit la suite de grammaires G; ; =< Vr,Vn,,S,R;; >. 


i, la grammaire G:;,;41 est obtenu en remplaçant, chaque règle de G; ; de la forme A; — A; par 


l’ensemble de règles {Ai — Ba |A; — B est une règle de G:; ;}. 


2. SiA;n'’est 


pas directement récursif à gauche dans G:;; alors G;:1 = Gi:i. 


3. Si A; est directement récursif à gauche dans G:;; alors G;,\ est construite ainsi : 


Soit A! un 


' . _ ! 
nouveau non-terminal : Vx,,, =, Vx, U {A}. 


On remplace les A;-règles par l’ensemble des règles 
{A;—B|A; —BER;; et $ ne commence pas par À;} 
U{A; — BA! |A; — BE R; et $ ne commence pas par A;} 


U{A! = 


| Ai — A;a € R;i} 


U{A’ + oA! | Aj—A;ùXE Rii}. 


Exemple 8.3 Soit la grammaire G\ de terminaux a,b,c,d,e, de non-terminaux A1,A2 et de règles 


b 
Aide 
n’est pas directement récursif. 


b 
Azad|\bd\e En remplaçant A1 par sa définition 
3 ci-dessous est obtenue par élimination de la récursion gauche directe sur A; : 


b 


À: > Aa 
A2 — Ac 
G2 = Gi, car A; 
G22 a comme règle : 
À: Ex Aa 
A2 — Ac 
La grammaire G 
Aj — Aa 


A2 —  bd\elbdA|eA’ 


! ! 
A, — cÀ; 


adA’,|clad 


Théorème 8.1 Soit G une grammaire sans £-règle et sans 1-règle. On peut construire une grammaire équivalente à 


G non récursive 


Preuve : On ado 


à gauche. 


pte les notations de l'algorithme [8.1] 


Il est évident que toutes les grammaires construites sont équivalentes. En effet les transformations de grammaires 
utilisées sont des substitutions générales et des éliminations de la récursion directe gauche, et les théorèmes E2letf7.1] 
montrent que ces transformations changent une grammaire en une autre équivalente. 
Nous montrons, par induction, que la grammaire G,,, n’est pas récursive à gauche. 
Soit P(i, j) la propriété suivante de la grammaire Gi, j) : 
— Toutes les A;-règles où 1 < k < n ont des parties droites commençant par un terminal, ou de la forme A, où © 
a un premier symbole élément de V. 


Toutes les 
k<I. 
Toutes les 


Ak-règles où 1 < & < i ont des parties droites commençant par un terminal ou de la forme A/o où 


règles de la forme À; — A;0 où sont telles que k > j. 


— La partie droite de toutes les règles d’entête un nouveau non-terminal, commencent par un élément de V. 
Nous montrons que pour tout i, j, P(i, j) est vraie. 


1 Sil<i< 


net j <iet si P(i, j) est vraie alors P(i, j + 1) est vraie. 


Supposons que 1 <i<n, j < i et que la propriété P(i, j) est vérifiée. 


Puisque la 
{A; — Ba 


grammaire G(i, j + 1), est obtenue en remplaçant toutes règles de la forme À; — À; par 
|A; — BE Ri;}, et que, d’après la propriété P(i, j), toutes les chaînes B commencent par un terminal 


ou s’écrivent Azy où k > j et y commence par un symbole de V, alors tous les nouvelles règles de G{(i, j +1) 
sont de la forme À; — 8 où à commence par un terminal ou est de la forme An où k > j + 1 et commence par 
un symbole de V. 

Par suite la propriété P(i, j + 1) est vérifiée. 


2. Puisque G11 — G1 = G, et que G est sans e-règle et sans 1-règle, alors la propriété P(1,1) est vérifiée. 


3. Pour 1 <i 


< n alors P(i, 1) implique P(i+1,1). 


Supposons que 1 <i< n et que la propriété P(i, 1) vérifiée. 
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Puisque P(i, 1) est vraie et que pour j < i, P(i, j) implique P(i, j + 1), alors par induction sur j, P(i,i) est vraie. 
On examine deux cas suivant que le non-terminal À; est ou n’est pas directement récursif à gauche dans G:;;. 


(a) Supposons que À; n’est pas directement récursif à gauche. 
Par définition Gin = Gji1 = Gi. 
Puisque la propriété P(i,i) est vérifiée et, vu l’absence de récursion directe gauche sur À;, toutes les A;- 
règles où 1 < k < i ont des parties droites commençant par un terminal ou de la forme A;0t où i < k. Donc 
la propriété P(i+ 1,1) est vérifiée. 


(b) Supposons que À; est directement récursif à gauche. 
La grammaire G;:11 = G;:1 est obtenu par élimination de la récursion directe gauche, autrement dit les 
A; règles de R;; sont remplacées par l’ensemble de règles 
{A;—f$B]A; —BE R;; et f ne commence pas par A;} 
U{A; — BA! |A; BE R;; et ne commence pas par A;} 
U{A! — | Aj— AjXE R;;} 
U{A! > oA! | A; — A;ja € Rii}. 
D'après la propriété P(i,i), les chaînes & commencent par un élément de V, donc toutes A! règles com- 
mencent par un élément de V. 
D’après la propriété P(i,i), les chaînes B commencent par un terminal ou s’écrivent À ;y où j > i et ycom- 
mence par un symbole de V. 
Donc tous les nouvelles règles de G;:1 = G(i+ 1,1) sont de la forme À; — ô où Ô commence par un ter- 
minal ou sont de la forme A;n où k > j + 1 et n commence par un symbole de V. 
Par suite P(i+ 1,1) est aussi vérifiée. 


4. La grammaire G,,1 n’est pas récursive à gauche. 
On a vu ci-dessus que P(1,1) est vraie et que pour tout 1 <i<n, P(i, 1) implique P(i+1,1). Donc par induction 
la propriété P(n + 1,1) est vérifiée. 
Par suite la grammaire Gh41, Où Gn+1 = Gn+11 vérifie : 


(a) Toute partie droite d’un A;-règle (où 1 < i < n) commence par un terminal ou par À ; où i < j. 
(b) Tout nouveau non-terminal a une partie droite commençant par un élément de V 


De ces deux propriétés, il résulte que G, n’est pas récursive à gauche. En effet 

— Supposons que À; = ©. 
Par induction sur la longueur de cette dérivation, &œ commence que par un terminal ou un non-terminal À ; où 
j > i. Donc les non-terminaux À; ne sont pas récursifs à gauche. 

— Supposons que A! =* a. 
Puisque les parties droite des A!-règles commencent par un élément de B, il existe un élément B € V et des 
chaînes f, 7, à telles que : 
* A! = BB =* yo 
* B—*7yet B —=* 6 et à — yo 
Puisque B engendre ou est égal à y, alors d’après ce qui vient d’être démontré, y, donc aussi &, commence par 
un symbole de V. Donc les non-terminaux A! ne sont pas récursifs à gauche. 

Par suite la grammaire G,,1 n’est pas récursive à gauche. 


Notons un conséquence immédiate du théorème. Toute grammaire est équivalente au mot vide près à une grammaire 
non récursive à gauche. Il suffit d’éliminer dans l’ordre les e-règles, les 1-règles, puis d’appliquer l'algorithme [8.1] 
ci-dessus. 


9 Forme normale de Greibach 


Définition 9.1 Une grammaire est sous la forme normale de Greibach si toutes ses règles sont de la forme 
A — aB;...B, où p > 0, a est un terminal et les B; sont des non-terminaux. 
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Algorithme 9.1 Soit G—< Vr,Vy,S,R > une grammaire hors-contexte sans £-règle, et non récursive à gauche. L'al- 
gorithme transforme G en une grammaire équivalente dont toutes les parties droites de règles commencent par un 
terminal. 
Considérons la relation g suivante entre les symboles de Vy : 
À g B si et seulement si il existe une chaîne à telle que À =* Ba. 
Cette relation est un ordre partiel : en effet, elle est évidemment transitive, et, puisque la grammaire n'est pas récursive 
à gauche, elle est irréflexive. 
Par suite il existe un ordre totaP] c’est-à-dire une liste sans répétition des symboles de Vy, A1,...,A, prolongeant 
l’ordre partiel c’est à dire tel que si À; g A; alors i < j. 
Si A; — A;0 est une règle de G, alors À; g À; donc j > i. Puisque G ne comporte pas d’e-règles, les autres règles de 
G commencent par un terminal. 
Une fois numérotés les non-terminaux dans l’ordre indiqué, on construit par des substitutions générales une gram- 
maire dont toutes les règles commence par un terminal. 
Pour i de n à 1, on construit la suite de grammaires G; =< Vr,Vw,S,R; > de la façon suivante : 

— Gr =G 

— pourn > i> 2 la grammaire G;_\ est obtenue en remplaçant chaque règle de G; de la forme A;_1 — A;a par 

{Ai-: — Ba|A; — B € Ri}. 


Théorème 9.1 Soit G—< Vr,Vn,S,R > une grammaire hors-contexte sans £-règle, sans 1-règle, non récursive à 
gauche. Soit V = Vr ÜUVy. On peut construire une grammaire équivalente dont toutes les parties droites de règle 
commencent par un terminal. 


Preuve : On adopte les notations de l'algorithme [OT] 

Il est évident que toutes les grammaires construites sont équivalentes. En effet les transformations de grammaires util- 
isées sont des substitutions générales et le théorème [T.7]montre que ces transformations changent une grammaire en 
une autre équivalente. 

Nous montrons que toutes les parties droites des règles de la grammaire G; commencent par un terminal. 


Soit P(i) la propriété suivante de la grammaire G; : 
(a) pour tout j < i, toutes les parties droites de À ;-règles commencent par un terminal ou sont de la forme A; où k > j. 
(b) pour i < j, toutes les parties droites des À ;-règles commencent par un terminal. 


1. P(n) est vérifiée. 
D’après l’ordre adopté des non-terminaux, toutes les règles de G commencent par un terminal ou sont de la 
forme À; — A ;0 où j > i. 
Comme il y a ñn non-terminaux, les 4, règles commencent par un terminal. 
Puisque G, = G, P(n) est vérifiée. 

2. Pour i > 2, P(i) implique P(i—1). 
Supposons i > 2 et la propriété P(i) vérifiée. 
Toute A;_;-règle de G; qui ne commence pas par un terminal, commence par un non-terminal À ; où à < j. Par 
construction, À ; est remplacé par les parties droites des À ;-règles et d’après P(i), ces parties droites commencent 
par un terminal. 
Donc après ces remplacements, la propriété P(i— 1) est vérifiée. 

3. Par induction puisque P(n) est vérifiée et puisque, pour tout i > 2,P(i) implique P(i— 1), il résulte que P(1) est 
vérifiée. Donc tous les parties droites de règles commencent par un terminal. 


Théorème 9.2 Pour toute grammaire hors-contexte, on peut construire une grammaire équivalente à £ près sous 
forme normale de Greibach. 


Preuve : Soit G=< Vr,Vy,S,R > une grammaire hors-contexte et V = Vr U Vy. 
Soit A1,...,4, une liste sans répétitions des non-terminaux de cette grammaire. 
La construction de la grammaire sous forme normale de Greibach, est faite en plusieurs étapes dans l’ordre ci-dessous : 


2 Cet ordre est calculable par l’algorithme du tri topologique 
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. Élimination des e-règles décrite au paragraphe[] 


. Élimination des 1-règles décrite au paragraphe[] 
Puisque l’élimination des 1-règles n’introduit pas d’e-règles, la grammaire obtenue après cette étape, est sans 
e-règle et sans 1-règle. 


. Élimination de la récursion à gauche par l'algorithmel8.1| 
Comme résultat de cet algorithme, on obtient une grammaire G =< Vr,Vw,S,R! > avec Vy = WUE ou E est 
un ensemble de nouveaux non-terminaux et les règles de R’ ayant les propriétés suivantes : 


(a) La partie droite des règles ayant pour entête un nouveau non-terminal commence par un élément de V 
(b) Toute partie droite d’une À; règles (où 1 < i < n) commencent par un terminal ou par un non-terminal À ; 
où j >i. 
Soit B1,...,B, une liste sans répétition des nouveaux non-terminaux. Il en résulte que l’ordre total utilisé dans 
l'algorithme [5.T]n’a pas besoin d’être calculé, il peut être défini par la liste B1,...,B,,A1,...,4, dans laquelle 
tout non terminal À précéde tout non-terminal B tel que À g B (c’est-à-dire tels que il existe une chaîne «x: telle 
que À =* Ba). 


. Transformation de la grammaire G’ en une grammaire dont tous les parties droites de règle commencent par un 
terminal. Il suffit d’appliquer l’algorithme[O.1] avec l’ordre total des non-terminaux déjà défini ci-dessus. 


. Passage à la forme normale de Greibach. Il suffit de : 


(a) Remplacer chaque règle de la forme À — a@ par À — a où est obtenu en remplaçant chaque terminal 
b par un nouveau non-terminal b'. 
Par exemple la règle À — aBbaC où a et b sont des terminaux est remplacée par la règle À — aBb'a!C où 
a” etb' sont des nouveaux non-terminaux (avec un nouveau non-terminal pour chaque terminal). 


(b) Pour chaque terminal a, ajouter la règle a! — a 


Il est évident que cette transformation change une grammaire en une autre équivalente. 


91 


92 


Chapitre IX 


Conditions d’unicité des systèmes 
d’équation 


Ce chapitre est un complément du chapitre qui utilise les systèmes d’équation pour donner des définitions induc- 
tives des langages hors-contextes. Nous nous intéressons aux conditions nécessaires et suffisantes calculables pour 
qu’un système d’équation ait une seule solution. 

Ce chapitre est un hommage à Bruno Courcelle, voir{http://wuw.Tabri.fr/perso/courcell/| qui est l’auteur de 
cette étude intéressante et trop souvent oubliée. 

Dans le premier paragraphe, on définit un système strict et on montre qu’un tel système a une seule solution. Dans le 
deuxième paragraphe, on étudie des conditions nécessaires et suffisantes pour qu’un système ait une seule solution : 
un système riche la une seule solution si et et seulement si on peut le transformer par substitutions en un système 
strict et cette condition est calculable. 


1 Système strict 


Définition 1.1 (système strict) Le définition d’une variable d’un système est stricte si tous ses mots sont vides ou 
comportent un terminal. Un système d'équations est strict si toutes les définitions de ses variables sont strictes. 


Exemple 1.1 Le système S — aSb +Ee est strict. 
Le système S = SS + aSb +£e n'est pas strict. 


Théorème 1.1 Un système strict a une seule solution. 


Preuve : La preuve n’est qu’une généralisation de l’exemple étudié au paragraphe [Eu chapitre [TX] 

Soit S —< Vr,Vy,d > un système strict d'équations et V = Vr UV. 

Soit I la plus petite solution du système et J une solution quelconque. Supposons que ces deux solutions soient dis- 
tinctes. 

Il existe x une chaine terminale de longueur minimale et un non terminal À tel que x € J(A) et x & I(A), autrement dit, 
pour toute chaine terminale y de longueur inférieure à x et tout non terminal B, x € J(B) si et seulement si x € I(B). 
Donc il existe & un mot de la définition de À tel que x € J(œ) et x # I(@). 

Le mot & n’est pas une chaine terminale, car dans ce cas, nous aurions I(&) = J(&) = {a}. Donc & = B1B2...B, où 
B,B,...B, € V,n2> 1 et, puisque le système est strict, au moins un de ces symboles est un terminal et un autre un 
non terminal. 

Par définition des interprétations, il existe une suite x1,Xx2,...x, de chaines terminales telles que, pour i de 1 à n, 
Xi E J(B;) et x = x1x2...Xn. 

Soit B; est un terminal. Alors J(B;) = I(B;) = {xi} 


l'Un système riche est défini enf2.1 
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Soit B; est un non terminal. Puisque que le système est strict, une des chaines x1,x2,...x, est un symbole terminal, 
donc la longueur de x; est inférieure (strictement) à celle de x. Et, vu que la chaine x est la chaine la plus courte pour 
laquelle existe un non terminal À avec x € J(A) et x Z I(A), on a x; € I(B;). 

Par suite x € I(@), donc x € I(A) : on obtient une contradiction. Donc 7 — J et le système n’a qu’une solution. 


2 Conditions nécessaires et suffisantes d’unicité 
Soit Sun système d’équations, transformé par des substitutions générales Plen un système strict S’. D’après la propriété 
F-2]au chapitre [IX] toute solution de S est une solution de S’. D’après le théorème [1.1] un système strict n’a qu’une 


solution. Donc S n’a qu’une solution. 


Exemple 2.1 Le système d'équations S suivant n’est pas strict : 


E=T+E+T 
T=F+T*+F 
F=a+b+(£) 


Cependant on peut le transformer en un système strict S' par des substitutions générales : 
E=a+b+(E)+TxF+E+T 

T=a+b+(E)+T+xF 

F=a+b+(E) 

Donc S n’a qu'une solution. 


On peut se demander si le fait pour un système d’être transformable par des substitutions générales en un système 
strict est une condition nécessaire et suffisante d’unicité des solutions. Un exemple nous montre que ce n’est pas tout 
à fait le cas. 

Soit le système S = SS + a+e. Par des substitutions générales, il est impossible de transformer ce système en un 
système strict. Lorsque le vocabulaire terminal ne comprend que la lettre a, l’unique solution de ce système est S = a*. 
Par contre lorsque le vocabulaire terminal comprend les deux lettres a et b, le système a les deux solutions S = a* et 
S=(a+b)*. 


Définition 2.1 (Système riche) Un systeme d'équations est riche, si et seulement si, l’ensemble des mots de la plus 
petite solution du système est strictement inclus dans l’ensemble des chaines sur le vocabulaire terminal du système. 


Lorsque l’on considère le système S — S$S + a +E£ comme ayant le vocabulaire terminal {a}, il n’est pas riche. Mais il 
est riche, si l’on considère que son vocabulaire terminal est {a,b}. On montre dans la suite qu’un système riche a une 
seule solution si et seulement si il est transformable par des substitutions générales en un système strict. 


Définition 2.2 (Variables potentiellement strictes) Soit S —< Vr,Vy,d > un système d'équations et V = Vr UVx. 
Soit E l’ensemble de variables engendrant la chaine vide au moyen des règles du système. On a vu, au paragraphe [3] 
du chapitre [VIT] comment calculer cet ensemble. 

Soit f : P(V») — P(Vw) la fonction suivante : 

pour tout X C Vy, f(X) = {A € Vy | Va € d(A),a € X*UV*VrV*UV*(X —E)V*}. 

La fonction f est une fonction croissante sur le treillis fini P(Vn) ordonné par l'inclusion. Puisqu'on sait calculer E, la 
fonction f est calculable. En suivant l’exemple du calcul de l’ensemble des symboles productifs donné au paragraphe 
ETdu chapitre [VITI] cette fonction a un plus petit point fixe F calculable ainsi : 

Soit n le nombre de variables du système, F — f'(0) où i est le plus petit entier inférieur à n tel que f(©) = f'+\(©). 
F est l’ensemble des variables potentiellement strictes du système : ce nom vient, comme on le voit ci-dessous, de ce 
que F comporte les variables strictes du système ainsi que les variables qui peuvent devenir strictes par substitution. 


Lemme 2.1 Soit S un système d'équations et F l’ensemble des variables potentiellement strictes du système. Si F est 
l’ensemble des variables de S, alors S est transformable par substitutions en un système strict. 


2On rappelle qu’une telle substitution consiste à remplacer dans les définitions du système, des occurrences de variables par leur définition 
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Preuve : Soit S —=< Vr,Vy,d > un système d’équations et V = Vr UV. 
Soit F l’ensemble des variables potentiellement strictes du système. 
Soit f : P(Vy) — P(Vw) la fonction suivante : 
pour tout X C Vy, f(X) = {AE VW |Vae d(A),ae X*UV*VrV*UV*(X —E)vV*}. 
On sait que F est le plus petit point fixe de f et qu’il existe un entier i tel que F = f'(@). 
Pour tout entier j, posons F; = f/(@). 
Soit So =S$ et S;,1 le système ainsi obtenu : dans les définitions de S;, on remplace routes les occurrences de variables 
par leur définitions dans S;. 
Montrons que : 
(#) pour tout entier j, l’ensemble F; est inclus dans l’ensemble des variables strictes du système S;. 
Pour j = 0 c’est évident puisque F est l’ensemble vide. 
Supposons que F; est inclus dans l’ensemble des variables strictes du système S ; et montrons qu’il en est de même en 
remplaçant j par j +1. 
Soit À € F;,1. On examine deux cas. 
1. Supposons À € F;. Par hypothèse d’induction, À est strict dans S';. Puisque S;,, est obtenu par substitution sur 
S;, la variable À reste stricte dans S;,1. 


2. Supposons À  F;. Par définition de F;,1, toutes les règles À — « sont telles que : 
œ € F*UV*VrV*UV*(F —E)V*. 
Soit À — f une règle de S;}1, obtenue en remplaçant dans © les variables par leurs définitions dans S;. Montrons 
que B est vide ou comporte un terminal. On examine trois cas suivant l’ensemble dont & est élément. 


(a) Soit &« € F*. Par hypothèse de récurrence toute variable de © est stricte dans S;, donc est remplacée par la 
chaine vide ou des chaines comportant un terminal. Par suite B est vide ou comporte un terminal. 


(b) Soit & € V*VrV*. Alors B comporte un terminal, puisqu’il y en a déjà un dans ©. 


(c) Soit &æ € V*(F; —E)V*. Donc & comporte une variable X € F; —E. Par récurrence cette variable est stricte 
dans S;, donc les mots de sa définition sont vides ou comprennent un terminal. Puisque cette variable ne 
produit pas la chaine vide, ses parties droites de règles comportent toutes un terminal, qui, en remplaçant 
X par sa définition dans S;, se retrouve dans f. 


Donc la variable À devient stricte dans S;,1. 


Supposons que F est l’ensemble des variables du système S. 

On sait qu’il existe un entier i tel que F = F;. D’après la propriété (*), pour tout j, F; est inclus dans l’ensemble des 
variables strictes de S;. 

Puisque l’ensemble des variables ne change pas, toutes les variables de S; sont strictes. Donc le système S;, obtenu en 
transformant S par des substitutions, est strict. [ 


Lemme 2.2 Soit S —=< Vr,Vy,d > un système d'équations et F l’ensemble des variables potentiellement strictes du 
système. Soit F = Vy — F l’ensemble complémentaire de F. Pour toute variable À, on a : 


1. AEF si et seulement si pour tout & € d(A), ona:@&€ F*UV*VrV*UV*(F —-E)V*. 
2. AEF si et seulement si il existe une chaine & € d(A), telle que : a € (EUF)*F(EUF)* 


Preuve : Soit f : P(Vy) > P(Vy) la fonction suivante : 
pour tout X C Vy, f(X) = {AE W|Vae d(A),ae X*UV*VrV*UV*(X —E)vV*}. 
On sait que F est le plus petit point fixe de f, donc f(F) = F, ce qui est équivalent à la première propriété. 
La négation de la condition & € F*UV*VrV*UV*(F — E)V* est la conjonction des 3 propriétés 
(a) & & F*, autrement dit un des symboles de @ n’est pas dans F, c’est-à-dire & € V*FV*. 
(b) à« Z V*VrV*, autrement dit tous les symboles de & sont des variables, c’est-à-dire & € WY. 


(ce) « g V*(F —E)V*, autrement dit tous les symboles de & sont éléments de F-EoùF-E=FNE-=EUF 
Puisque tous les éléments de EUF sont des variables, la condition (c) implique la condition (b), et donc la conjonction 
des propriétés (a, b, c) est équivalente à la conjonction de la propriété (b) «un des symboles de & est élément de F> et 
de la propriété (c), «tous les éléments de «& sont éléments de EUF». 

Par suite la négation de la condition & € F*UV*VrV*UV*(F —E)V* est a € (EUF)*F(EUF). 
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Donc la propriété [est obtenue en remplaçant dans la propriété [Î]les deux membres de l’équivalence par leur néga- 
tions : elle est donc équivalente à la propriété [1] 


Lemme 2.3 Soit S un système riche d'équations (voir définition[Z. 1]. Soit F l’ensemble des variables potentiellement 
strictes du système. Si F n'est pas l’ensemble de toutes les variables du système, alors S a plusieurs solutions. 


Preuve : Soit S —< Vr,Vw,d > et 1 la plus petite solution de S. Puisque S'est riche, il y a une chaine terminale w qui 
n'appartient pas à [J{/(A) | À € Vy}. 
Soit F = Vy —F, le complément de F et J l'interprétation suivante définie pour toute variable À par 
- SAEF alors J(A) = {e,w} 
- siAE€EENF alors J(A) = {£}. 
On rappelle que E est l’ensemble des variables engendrant € grâce aux règles du système. 
- siA€F—E alors J(A) — 0. 
Soit fs la fonction définie par le système S (voir la définitionf3.Adu chapitre[X). On montre tout d’abord que J C fs(J), 
c’est-à-dire que pour tout À € Vw, J(A) C fs(J)(A). 
On examine trois cas suivant la définition de J : 
1. SoitA€ F.J(A) = {e,w}. 
D’après le cablau lemmef.2] il existe une chaine & € d(A) telle que & € (EUF)*F(EUF)*. 
Notons que tous les symboles de © sont des variables. Soit B une telle variable. 
Puisque B € EUF et que EUF =(ENF)UF, d’après les deux premiers cas de la définition de J, on a € € J(B). 
D'autre part il y a symbole C de à tel que C € F,, donc par définition de J, J(C) = {e,w}. 
Par suite {e,w} C J(a@), donc J(A) C fs(J)(A). 
2. Soit AE ENF.J(A) = {e}. 
Puique À € E, il existe & € d(A)NE*. D’après le cas[f]du lemme[2.2| on a nécessairement & € F*. Donc toutes 
les variables B de ot sont éléments de ENF, et, par définition de J, J(B) = {£}. 
Par suite {e} C J(@), donc J(A) C fs(J)(A). 
3. SoitA€ F —E.J(A) —0 donc J(A) C fs(J)(A). 
Soit alors l'interprétation K = U{fi(J) | i > 0}. 
Puisque 7 C f$(J) et que fs est une fonction continue (voir le théorème B:iJau chapitre Ex}. on déduit, en remplaçant 
dans la preuve du théorème de Kleene (voir £.1] du chapitre IX) l’élément L par J, que K est un point fixe de fs, 
c’est-à-dire une solution du système S. 
Par hypothèse, F n’est pas vide. Soit À € F. De ce que J C K, on déduit que w € K(A). Puisque w £ U{/(A) | A € Ww}, 
on sait que w & I(A). 
Donc le système S a deux solutions distinctes. Ü 


Théorème 2.1 Soit S un système d'équations qui est riche et F l’ensemble de ses variables potentiellement strictes. 
Les trois propriétés suivantes sont équivalentes : 

(1) Sn'’a qu'une solution. 

(2) F est l’ensemble des variables de S 

(3) S est transformable par substitution en un système strict 


Preuve : (1) implique (2) : c’est la contraposée du lemme ci-dessus [2.3] 

(2) implique (3) : c’est le lemme [.T] 

(3) implique (1) : Supposons que S est transformable par substitutions en un système strict S’. D’après le théorème [5.2] 
du chapitre[IX] toute solution de S est solution de S’. D’après le théorèmel.1] le système strict S’ n’a qu’une solution. 
Donc S n’a qu’une solution. 


3 Problèmes de décision 


Un problème est décidable, s’il y a un algorithme pour le résoudre. Nous renvoyons à l’ouvrage pour plus de 
précisions sur ces notions. 
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3.1 Le problème «un système est-il riche ?» est indécidable 
3.1.1 Système riche : rappel 


Soit S —< Vr,Vy,d > un système et V = Vr U Vy. Vy est l’ensemble des variables et d : Vy + P(V) donne la définition 
de chaque variable. 

L'ensemble R$ des règles de S est l’ensemble des règles À — « telles que & € d(A). 

Soit À une variable. On note GsA la grammaire < Vr,Vy,Rs,A > et L(GsA) le langage qu’elle engendre. 

Le système S est riche si et seulement si U{L(GsA4) | À € Vy} est un sous-ensemble strict de V;. 


3.2 Indécidabilité du problème «un système est-il riche ?» 


Soit G=< Vr,Vy,S,R > une grammaire hors-contexte. 
Le théorème 8.11 p203 du livre [5l, nous dit que le probleme «L(G) = V; ?» est indécidable. 


Nicolas Peltier (http://membres-liqlab.imag.fr/peltier/) a trouvé une réduction de ce problème au problème 


«un sytème est-il riche ?» : autrement dit, si le problème «un système est-il riche ?» était décidable, le problème 
«L(G) = Vj ?» serait décidable. 
Comme ce dernier problème n’est pas décidable, il en est de même du problème «un sytème est-il riche ?». On présente 
ci-dessous les principes de cette réduction. 
Soit G=< Vr,Vy,S,R > une grammaire hors-contexte. 
À cette grammaire on associe le système S’ —< V;,V},d > suivant : 
1. V£ est le vocabulaire terminal V7 auquel on ajoute la nouvelle lettre e. 
T q J 
2. Vy est l’ensemble de variables Vy auquel on ajoute les nouvelles variables A,B,C,D,E. 
3. Les règles de S’ sont les suivantes 
(a) Les règles de R 
(b) A=es. 
Autrement dit À engendre l’ensemble des mots eL(G). 


(c) B engendre l’ensemble des mots ne commençant pas par le nouveau terminal e. 


Les règles pour B sont : B—Ee+{ala € Vr}(C+CeB+CEB) 


C engendre V; et E engendre ee*. 


(d) C=e+{ala € Vr}C 
(e) E=ee+eE 
(f) D engendre l’ensemble des mots comportant au moins deux e. 
Les règles pour D sont : D = CeCeB +CeCEB 
On laisse au lecteur le soin de vérifier, qu’avec les règles ci-dessus, B engendre l’ensemble des mots ne com- 
mençant pas par e et D engendre l’ensemble des mots comportant au moins deux e. 
Notons U(S'), l’union des langages engendrés par chacune des variables de S”. 
D’après les propriétés de A,B,C,D,E, on a: L(Gs.c) C L(Gs8) et L(Gs) € L(Gs p). 
Puisque toutes les variables de la grammaire G engendrent des mots sans e, donc éléments de L(Gs 8), il en résulte 
que : U(S’) = L(Gs 4) UL(Gs 8) UL(Gs p). 
Montrons que L(G) = V; si et seulement si U(S’) = V;* (c’est-à-dire si S’ n’est pas riche). 
1. Supposons L(G) = V. 
D’après cette hypothèse et le fait que À = es, on a : U(S") = eVSUL(Gs 8) UL(Gs p). 
Soit w € Vr. 
(a) w — €, donc w € L(Gs 8) et par suite w € U(S') 
(b) w a une seule occurrence de e. On a deux cas suivant que cette occurrence est ou n’est pas la première 
lettre de w. 
i. e est la première lettre de w. Donc w € eV et par suite w € U(S'). 


ii. e n’est pas la première lettre de w. Donc w € L(Gs 8) et par suite w € U(S"). 


97 


(c) w a au moins deux occurrrences de e. 
Puis que D engendre l’ensemble des mots comportant au moins deux e, w € L(Gs p) et par suite w EU(S'). 


Par suite w € U(S'), donc U(S’) = V*. 


2. Supposons U(S') = V}*. 
Soit w € V}. Puisque ew n’est engendré ni par B, ni par D, ew € eL(G). Par suite w € L(G), donc L(G) = V; 


3.2.1 Le problème «un système a-t-il une seule solution ?» est relativement décidable 


Soit S un système riche. Le problème «S a-t-il une seule solution ?» est décidable puisque, d’après le théorème 
ci-dessus[2.1] on peut le résoudre en calculant l’ensemble des variables potentiellement strictes de S. 
Soit S —< Vr,Vy,d > un système quelconque. Si l’on est pas certain que ce système est riche, on peut le transformer 
en un système riche, en ajoutant à V7 des lettres qui ne figurent pas dans les règles de S. 


98 


Bibliographie 


[1] Michael A Harrison. Introduction to Formal language theory. Addison-Wesley, 1978. 
[2] Jean-Michel Autebert. Théorie des langages et des automates. Masson, 1994. 


[3] Walter Bucher and Hermann Maurer. Theoretische Grundlagen de Programmier-sprachen. Bibliographisches 
Institut, 1984. 


[4] Seymour Ginsbourg. The mathematical theory of context-free languages. MacGraw-Hill, 1979. 


[5] John E. Hopcroft and Jeffrey D. Ullmann. /ntroduction to automata theory, languages and computation. Addison- 
Wesley, 1979. 


99 


